一些小疑问&解答

八爪鱼和火车头&python爬虫

  • 都是爬虫工具
  • 傻瓜式工具:八爪鱼、火车头等,根据提示点点鼠标,输入几个字就完了,但是这种工具普遍得到的结果不是很理想。
  • 自开发式工具:python的话写爬虫真的是一种神器般的存在,目前网上的爬虫程序,可能百分之八九十都是用Python写的。

来源:https://blog.csdn.net/ajian6/article/details/101773899?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~first_rank_v2~rank_v25-2-101773899.nonecase&utm_term=%E6%9C%89%E5%85%AB%E7%88%AA%E9%B1%BC%E8%BF%98%E8%A6%81%E5%AD%A6%E7%88%AC%E8%99%AB%E5%90%97

  • 八爪鱼毕竟只是工具,自由度肯定完败编程。胜在方便,快速,低成本。
  • 八爪鱼判断语录较弱,无法进行复杂判断,也无法执行复杂逻辑。
  • 没有ocr功能,58同城和赶集网采集的电话号码都是图片格式,python可以用开源图像识别库解决,对接进去识别便可。
  • 八爪鱼目前所达到的技术和产品能力,一般的技术团队用python是无法达到的。

来源:https://www.zhihu.com/question/36011203

实习公司让我们用八爪鱼和火车头采集信息,看了科普后,觉得很有道理的,我可太菜了,所以我打算两边继续都学习。

posted @ 2020-09-28 10:42  _DL  阅读(95)  评论(0)    收藏  举报