Agenty - 高级网页爬取工具

chromegood 0人评论 2620次浏览 Chrome开发者工具插件
摘要 : Agenty提供的一个非常简单和高级的数据抓取扩展,使用带有实时提取数据预览的点击式CSS选择器从网站中提取数据,并快速将数据导出到JSON / CSV / TSV。

Agenty - Advanced Web Scraper背景简介

工作中你可能会有抓取网站内容的需求:淘宝上的商品介绍、网站上的新闻标题、表格中的行列数据……如果只是单纯的复制粘贴,之后还要费心整理,想要写个爬虫又考验编程水平。小编今天给大家介绍一款chrome插件Agenty - Advanced Web Scraper 它可以实时提取数据预览的点击式CSS选择器从网站中提取数据,并快速将数据导出到JSON / CSV / TSV。

Agenty - Advanced Web Scraper 简介

Agenty提供的一个非常简单和高级的数据抓取扩展,使用带有实时提取数据预览的点击式CSS选择器从网站中提取数据,并快速将数据导出到JSON / CSV / TSV。为Agenty云平台或Windows桌面软件创建免费的Web scraper代理,Data Scraping Studio用于大数据提取和更高级的Web抓取功能:如调度,匿名网站抓取,网站抓取,提取100或数百万个网页,同时提取多个网站,将数据发布到服务器等等。

Agenty - Advanced Web Scraper 简介

Agenty - Advanced Web Scraper功能

1.从网页中提取任意数量的字段。
2.使用内置的CSS选择器只需单击一下即可生成模式。
3.编写自己的自定义CSS选择器。
4.选择要提取的项目。例如TEXT,HTML或ATTR 
5.选择CSS选择器后立即查看结果预览。
5.左/右切换位置。
7.以最流行的文件格式JSON,CSV或TSV导出输出

Agenty - Advanced Web Scraper使用方法

1.Agenty - Advanced Web Scraper插件离线安装的方法参照一下方法:老版本chrome浏览器,首先在标签页输入【chrome://extensions/】进入chrome扩展程序,解压你在本站下载的插件,并拖入扩展程序页即可。

Agenty - Advanced Web Scraper使用方法

2.最新版本的chrome浏览器直接拖放安装时会出现“程序包无效CRX-HEADER-INVALID”的报错信息,参照:Chrome插件安装时出现"CRX-HEADER-INVALID"解决方法,安装好后即可使用。

3.安装完毕,图标会出现在浏览器右上方。

Agenty - Advanced Web Scraper使用方法

4.转到要提取的网站,然后启动应用程序。

5.单击要提取的网页元素(它将变为绿色)。然后,Web抓取应用程序将为该元素生成最佳的CSS选择器,并突出显示(黄色)该选择器匹配的所有内容。


Agenty - Advanced Web Scraper使用方法

6.现在,您可以单击突出显示的元素以将其从选择器中删除(红色),或单击未突出显示的元素以将其添加到提取器。通过这个选择和拒绝过程,Web Scraping App将帮助您为需要提取的项目提供完美的CSS选择器。

Agenty - Advanced Web Scraper使用方法

7.使用TEXT,HTML或ATTR(属性)提取任意数量的字段,并提取提取数据的即时输出。

Agenty - Advanced Web Scraper使用方法

Agenty - Advanced Web Scraper官网:

 http://www.agenty.com

Agenty - 高级网页爬取工具下载地址

点击下载Agenty - 高级网页爬取工具

转载必须注明来自: Chrome插件 » Agenty - 高级网页爬取工具

下一篇 : 屏蔽百度推广
评论:(0)

已有 0 位网友发表了一针见血的评论,你还等什么?