gg下载站:安全、高速、放心的专业下载站!

当前位置:首页 > 网络工具 > 上网辅助 > 爬山虎采集器 v3.0.3.2官方版

爬山虎采集器 v3.0.3.2官方版

爬山虎采集器 v3.0.3.2官方版

爬山虎采集器下载评分:8.3
下载地址
  • 软件大小:39 MB
  • 软件语言:简体中文
  • 更新时间:2021-09-13
  • 软件类别:网络工具 / 上网辅助
  • 软件性质:共享版
  • 官方网址:http://www.51pashanhu.com/
  • 运行环境:winall
  • 软件等级:
  • 软件标签:

点赞 () 差评 ()

  • 软件介绍
  • 猜您喜欢
  • 相关文章
  • 相关专题

爬山虎采集器是一款通用的网页采集软件,它能够采集互联网上的大部分网站数据,包括网页表格数据、文档、图片及其他各种形式文件,自动批量下载到本地电脑。可以将采集的数据导出为各种格式文件、数据库、网站API接口。 可以定时运行,自动发布,增量更新采集,完全实现自动化运行,无需要人工干涉。极大提高人们从互联网上获取数据的效率。

爬山虎采集器

软件特色

1.简单好用

简单易学,通过可视化界面、鼠标点击即可采集数据、向导模式,用户无需任何技术基础,输入网址,一键提取数据。代码小白的福音。

2.海量采集模板

内置大量网站采集模板,覆盖多个行业,点击模板,即可加载数据,只需简单配置,就可快速准确获取数据,满足各种采集需求。

3.自研智能算法

通过自研的智能识别算法,可以自动识别列表数据识别分页,准确率达到95%,可以深入采集多级页面,快速准确的获取数据。

4.自动导出数据

数据可以自动导出发布,支持多种格式导出,TXT、CSV、Excel、Access、MySQL、SQLServer、SQLite以及发布到网站接口(Api)等。

5.通用灵活

99%网站可以采集,静态网页、动态页面、单页应用、手机APP都可以抓取,GET、POST都可以采集

6.高速采集

内置高效浏览器引擎、HTTP引擎、JSON引擎,经过极致优化的内核,多线程采集,快速如飞。

7.增量更新

通过定时运行和增量更新,可以使得采集任务完全实现自动化运行,实时监测目标网站,实现同步更新。

8.批量文件下载

可以自动下载图片、PDF、DOCX等各种文件,并且支持自定义保存目录、自定义文件名称。

使用说明

创建第一个采集任务

首先,打开爬山虎采集器,点击主界面的新建任务按钮

第一步、选择起始网址

当你想要采集一个网站数据时,首先需要找到一个展示数据列表的地址。 这一步,至关重要,起始网址决定了你采集的数据数量和类型。

以大众点评为例,我们想要抓取当前城市的美食类的商家信息,包括店名、地址、评分等等信息。

通过浏览网站,我们找到所有美食类的商家列表地址: http://www.dianping.com/search/category/110/10

然后在爬山虎采集器V2中 新建任务 -> 第一步 -> 输入网页地址

然后点击下一步。

第二步、抓取数据

进入到第二步后,爬山虎采集器会智能分析网页,并且从中提取出列表数据。 如下图:

这时,我们对已经分析出的数据进行整理修改, 比如删掉无用的字段。

点击列的下拉按钮,选择 删除字段 。

当然还是其他操作,比如修改名称,数据处理等等。这些我们将在后面的文档中介绍。

在整理修改字段后,我们来采集处理分页。

选择分页设置->自动识别分页,程序将会自动定位下一页 元素。

完成之后,点击下一步。

第三步、设置

这里包括对浏览器的配置,比如禁用图片、禁用JS、禁用Flash、拦截广告等等操作。可以通过这些配置提高浏览器的加载速度。

计划任务的配置,通过计划任务,可以设置任务定时自动运行。

点击完成,保存任务。

完成,运行任务

任务创建完成之后, 我们选择刚刚新建的任务,点击主界面工具栏 开始 按钮。

任务运行窗口,任务运行日志,记录详细采集日志信息。

已采集数据窗口,实时显示已采集的数据

更新日志

新增对数据进行预览、编辑的功能选项。

数据处理新增了一个补全URL的功能。

单个脚本命令能够设置所有分页执行。

展开内容

系统要求:所有 Windows 系统
运行环境:Net Framework 4.0

下载地址

相关文章

关于我们 | 联系方式 | 版权声明 | 下载帮助 | 广告联系 | 网站地图

本站所有软件均来自网络搜集发布 如有侵权请及时联系我们 我们将做删除处理

Copyright - 2019-2021 - online services.All rights reserved