如今的搜索引擎算法基本可以完全杜绝和抛弃那些采集的垃圾站了。但是道高一尺魔高一丈,自动化的爬虫技术仍然有很多是使用场景。我之前写过一篇《如何免费定制个人全自动化的“最勤劳员工”?》,一直都建议大家,只要是能用机器去完成的工作,就不要让人去重复做这件事情,对于人来说每一天都不会重来,即使你现在是二十来岁的阳光少年,人生也就剩2万多天而已。把不擅长的事情外包给别人做,把重复的工作交给机器做,把更多时间留给自己可以输出更有价值的事情上,你的工作和项目、生活才会发生质的变化。
上周#大航海计划#众筹了一款Wordpress工具,使用了一周,大概跟大家分享下使用场景和安装设置技巧。WPeMatico是一款基于RSS和Atom的Wordpress自动化插件,它的功能非常强大,也非常的完善,几乎可以满足市面上大部分的自动化采集需求。开头讲了现在采集站=垃圾站,但是采集和自动化并非一无是处,它还是可以帮助我们做很多的事情。所谓工欲善其事必先利其器,刀掌握在你手里,就看你怎么用了,我大概列一下它的使用场景:
1,可以基于RSS和Atom成为一个聚合网站,在国外比较成功的聚合网站有几个。
- https://alltop.com/
- http://popurls.com/
- https://theweblist.net/
- http://www.affow.com (这是我自己测试演示用的,该站所用的主题插件已经共享在社区了,WordPress建站付费插件.一句代码聚合所有的网站内容.)
2,适合做图片主题的站,自定义标题和Alt标签,SEO不会太差。
3,适合抓取国外的站,然后自动翻译为中文。WPeMatico Polyglot 支持抓取页面后翻译为107种语言,基于Google Cloud Translation API,Google Translate和Yandex Translate API。
4,适合去抓取那些屏蔽百度、Google、移动端的内容做SEO。(注意版权问题)
5,适合补充网站内容,非常规的精准匹配Adsense广告。
6,适合抓取一些有用的数据做分析。实时全网监控数据和通知。
7,还有诸如Facebook内容索引等等功能看教程文档,或者在群里问吧。
WPeMatico中国官网地址:www.WPeMatico.cn
PDF教程和使用文档到社区下载:https://bbs.fuyuzhe.com/affiliate/143.html
发表回复