Easy Scraper是一款Chrome浏览器的扩展插件,是一个网页数据抓取工具,通过一键操作,就能轻松地从网页中提取所需数据,并以CSV或JSON格式导出,方便后续分析或作为GPT系列模型(例如ChatGPT)的输入。
只需要在浏览器上安装扩展,然后打开需要抓取数据的网页,点击扩展图标,就可以立即开始抓取。它支持智能抓取网页的结构化数据,比如商品列表,文章目录等。并且可以自动遍历多页,递归抓取下级页面,非常适合抓取有层级结构的网站。
抓取后的数据可以一键导出成结构化的CSV或JSON格式。这些格式可以直接输入到Excel,Numbers等软件进行数据分析;也可以作为机器学习模型的训练数据;或者作为ChatGPT等大型语言模型的知识库。
最重要的是,它会自动处理现代网页的各种复杂情况,比如JavaScript动态渲染的内容,无限滚动加载的页面等。由于所有的处理都是在本地浏览器完成,它还保证了数据安全和隐私。
目前,这款工具免费向用户开放。
使用步骤
在Chrome Web Store安装Easy Scraper扩展。
打开任意包含所需数据的网站页面。
点击浏览器扩展区的Easy Scraper图标以激活工具。
如需,进行抓取内容的自定义设置,包括调整抓取项和速度。
选择所需格式导出数据,完成数据抓取过程。
更多信息和详细教程,请访问官方网站:Easy Scraper