摘要: 开始之前 首先我们要安装好pyspider,可以参考上一篇文章。 从一个web页面抓取信息的过程包括: 1、找到页面上包含的URL信息,这个url包含我们想要的信息 2、通过HTTP来获取页面内容 3、从HTML中提取出信息来 4、然后找到更多的URL,回到第2步继续执行~ 选择一个开始的URL 我 阅读全文
posted @ 2017-12-12 21:02 xingzhui 阅读(1026) 评论(0) 推荐(0) 编辑