爬虫工具对比
人事来了一个需求,需要爬取特定网站的一些数据,看着需求很简单,爬取的信息根据我的判断:1,不需要登录网站;2,最多几百个网站;。不过老板说了,以后说不定会有扩展其它需求。总之先选工具吧,工具呢我也不熟,都是百度来的人家想法,存粹记录一下,东西多了时间久了,脑袋就不够记啊。
借用人家介绍:https://blog.csdn.net/asd529735325/article/details/80360661,爬虫思路
首先,http://www.360doc.com/content/15/1024/20/1345766_508089377.shtml 这个文章说的对:
而我的是80%第二种
1,成品软件不考虑,介绍网页(http://www.pc6.com/pc/pachong/ ,https://blog.csdn.net/qq_35994328/article/details/53287968,);
2,java的爬虫工具不考虑,一看我就是懒;
python
1,https://www.cnblogs.com/mottled/p/7994150.html,哈哈哈,我的习惯又来了,复制黏贴
2, https://www.imooc.com/article/44716,
3,https://oidiotlin.com/beautifulsoup-vs-scrapy/ ,大家都说的很有道理啊,怎么选择呢,就怕把自己坑了,
(别人写的经验教程:https://www.cnblogs.com/zhaof/p/7406482.html,https://cuiqingcai.com/2599.html)
(爬取基本过程)https://blog.csdn.net/chen801090/article/details/95483284
posted on 2019-07-23 18:06 xiaofangne 阅读(481) 评论(0) 收藏 举报