精品为您呈现,快乐和您分享!

移动端

收藏本站

17软件园

当前位置: 首页 > 软件下载 > 网络工具

WebHarvy(网页数据抓取软件)v6.3.0.189免费版

WebHarvy(网页数据抓取软件)v6.3.0.189免费版

类型:网络工具 语言:英文

大小:80.2M 更新时间:2021-09-10

推荐指数:

应用简介


WebHarvy 是一个网络数据抓取工具。该软件可以从网页中提取文本和图像,并通过输入URL打开它们。它默认使用内部浏览器,支持扩展分析,可以自动获取相似链接列表。软件界面直观、易于操作。









WebHarvy 是一个网络数据抓取工具。该软件可以从网页中提取文本和图像,并通过输入URL打开它们。它默认使用内部浏览器,支持扩展分析,可以自动获取相似链接列表。软件界面直观、易于操作。



WebHarvy(网页数据抓取软件)



特征



智能识别模式



WebHarvy 自动识别网页中出现的数据模式。因此,如果您需要从网页中抓取项目列表(名称、地址、电子邮件、价格等),则无需执行任何其他配置。如果数据重复,WebHarvy 会自动抓取它。



导出捕获的数据



可以以各种格式保存从网页中提取的数据。当前版本的WebHarvy 网站抓取工具允许您将抓取的数据导出为XML、CSV、JSON 或TSV 文件。您还可以将抓取的数据导出到SQL 数据库。



从多个页面摘录



通常,网页在多个页面中显示数据,例如产品目录。 WebHarvy可以自动从多个网页中抓取和提取数据。只需指出“链接到下一页”,WebHarvy Website Scraper 就会自动从所有页面中抓取数据。



直观的操作界面



WebHarvy是一个可视化网页提取工具。实际上不需要编写任何脚本或代码来提取数据。使用webharvy 的内置浏览器浏览网页。您可以选择通过单击鼠标来提取数据。它是如此容易!



基于关键词的提取



基于关键字的提取允许您从搜索结果页面捕获输入关键字的列表数据。在挖掘数据时,您创建的配置将针对所有给定的输入关键字自动重复。可以指定任意数量的输入关键字



提取物分类



WebHarvy Website Scraper 允许您从指向网站内类似页面的链接列表中提取数据。这允许您使用单一配置来抓取网站内的类别或子部分。



使用正则表达式提取



WebHarvy 可以将正则表达式(正则表达式)应用于文本或网页的HTML 源代码并提取匹配的部分。这项强大的技术为您在争夺数据时提供了更大的灵活性。



WebHarvy



软件特点



WebHarvy 是一个可视化网络抓取工具。完全不需要编写任何脚本或代码来抓取数据。您将使用WebHarvy 的内置浏览器浏览网络。您可以选择要单击的数据。这很容易!



WebHarvy 自动识别网页中出现的数据模式。因此,如果您需要从网页中抓取项目列表(名称、地址、电子邮件、价格等),则无需执行任何其他配置。如果数据重复,WebHarvy 会自动删除它。



您可以以多种格式保存从网页中提取的数据。当前版本的WebHarvy Web Scraper 允许您将抓取的数据导出到Excel、XML、CSV、JSON 或TSV 文件。您还可以将抓取的数据导出到SQL 数据库。



通常,网页会在多个页面上显示产品列表等数据。 WebHarvy可以自动抓取并提取多个页面的数据。只需指出“链接到下一页”,WebHarvy Web Scraper 就会自动从所有页面中抓取数据。



变更日志



修复了启动页面时可能导致连接被禁用的问题



页面模式可配置独占连接方式



可以自动搜索可以在HTML上配置的资源



添加了向下滚动到下一页的键盘功能



添加了通过Java 脚本加载下一页的功能。



增加URL配置功能



可以在列表中输入关键字进行搜索2