通过简单设置可采集来自于任何网站的内容,并可设置多个采集任务同时进行,可设置任务为自动运行或手动运行,主任务列表显示每个采集任务的状况:上次检测采集时间,预计下次检测采集时间,最近采集文章,已采集更新的文章数等信息,方便查看管理。
文章管理功能方便查询、搜索、删除已采集文章,改进算法已从根本上杜绝了重复采集相同文章,日志功能记录采集过程中出现的异常和抓取错误,方便检查设置错误以便进行修复。
启用任务后,定时检测是否有新文章可更新,检测文章是否重复,导入更新文章,这一切操作程序都是全自动完成,无需人工干预。
有两种触发采集更新方式,一种是在页面内添加代码由用户访问触发采集更新(后台异步进行,不影响用户体验,也不影响网站效率),另外可以用Cron计划任务定时触发采集更新任务
定向采集只需要提供文章列表URL即可智能采集来自于任何网站或栏目内容。
不仅支持“通配符匹配”来采集网页内容,更完美支持各种CSS选择器,只需填写简单的形如 #title h1 的CSS选择器,便可精确采集网页任何内容。(如何设置CSS选择器)
支持设置关键词,如果标题中包含关键词才允许采集(或过滤掉不允许采集)。
支持设置多个匹配规则采集网页上的不同内容,甚至支持采集任何内容添加到“Wordpress自定义栏目”,方便扩展。
支持Google神经网络翻译,翻译质量显著提高,已接近人工翻译效果,将文章标题和内容翻译成其他语言,共支持多种语言之间相互翻译,轻松获取原创文章。使用Google翻译API无需翻墙,只需翻墙获取API相关设置信息设置好后即可正常使用,后续调用API翻译无需翻墙
支持有道神经网络翻译,接近人工翻译效果,有道翻译更懂中文,采集英文文章翻译成中文文章,轻松获取原创文章。
同时支持百度翻译,百度翻译每月翻译字符数低于200万,享免费服务
支持使用翻译引擎获取伪原创文章,不仅仅只是替换了同义词,更是语义的重新表述,唯一性、伪原创效果更好,支持各种语言。同时集成国外最优秀伪原创工具WordAi等,制作英文站可以获取可读性、唯一性都更好的伪原创文章。
支持远程图片下载到本地服务器,并可选择自动添加上文本水印或图像水印。其他任何格式的附件及文档也能轻松下载到本地服务器。
自动删除采集内容中的HTML注释,可设置删除标签中的id,class,style属性内容,消除采集的痕迹;自动给图片添加上alt属性,过滤链接,关键词替换,自动添加自定义链接,这些都有利于SEO。
支持内容过滤,过滤采集内容中不希望发布的内容(如广告代码,文章来源,版权等信息),甚至可以在文章任意位置添加上自定义内容,增强文章独特性;也可是设置采集后添加自定义样式功能
也支持HTML标签过滤功能,可过滤掉采集文章中的超链接,script和style标签下的不必要的代码。