【教程】蜘蛛池采集规则编写之标题库采集

标题库采集还是很简单的,只需要设置一下采集源的地址就可以。

首先添加采集规则,选择文章标题。

【教程】蜘蛛池采集规则编写之标题库采集

就是那么简单。。。

分页的写法:

http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_{p,1,9,1}.shtml

{p,1,5,1}表示分页,参数:p后面的数字分别代表开始、结束、递增/减值,即 {p,开始,结束,递增/减值}

http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_1.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_2.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_3.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_4.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_5.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_6.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_7.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_8.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_9.shtml

测试规则的时候可以从网址匹配里看到。

添加后,测试看看效果:

【教程】蜘蛛池采集规则编写之标题库采集

© 版权声明
THE END
文章版权归作者所有,未经允许请勿转载。本站资源均来自互联网,仅供研究学习,禁止违法使用和商用,产生法律纠纷本站概不负责!如果侵犯了您的权益请与我们联系!
点赞1454赞赏 分享
feizhuAdmin的头像-飞猪资源网钻石会员
评论 抢沙发

请登录后发表评论

    暂无评论内容

©文章声明