尽管小旋风后台自带的采集功能非常强大,但是许多群众也希望使用火车头来采集。
小旋风文章库是有特定的数据格式的。火车头直接采集的并不能直接使用,需要通过插件进行处理之后才可以使用。
值得注意的是,该插件仅在采集时对内容进行处理,处理后的数据入库。
插件分为2个文件,一个文件是内容保存模板,另一个是数据处理插件。
首先是放置小旋风内容模板的位置:
将 文件 “小旋风_内容模板.txt”
V7.6版本 放入 火车头程序目录下的 Extensions\\LocoySpider\\FileTemplate 文件夹。
V9版本放在 火车头程序目录下的 \\FileTemplate\\ (如果没有此文件夹,编辑任务第三步启动本地文件保存后自动生成)
以下图片是以V7.6版本为例,V9版本其实也差不了多少,只是路径有点不同。
接下来,是插件位置:
将文件 “小旋风_内容处理.php” 放入
V7.6版本 火车头程序目录下的 Plugins\\LocoySpider 文件夹。
V9版本 火车头程序目录下的 Plugins\\ 文件夹。
然后就是编辑任务采集规则,在发布内容设置里选择 保存为一个txt文件,设置txt的保存位置。选择文件模板。
文件名命名格式,一般用年月日命名。文件编码 UTF8
接下来再设置启用我们的插件就完成了。第四步,选择我们刚才保存的php插件,如图;
打开保存的txt看看:
将txt上传到小旋风后台:
预览看看:
以下补几张V9版本的设置图:
暂无评论内容