pyspider 爬取今日头条的关键字里文章
摘要:
1.先上一下爬取之后保存的成果,然后顺便将要求给说明一下,需要爬取的是文章等的标题,文章等的链接,以及文章的内容,含有div,和p标签,以及,img,但不包含alt标签, 2.设置请求headers,在craw_config中设置,当然,设置on_start方法中也是没有问题的 3.由于进入今日头长 阅读全文
posted @ 2018-06-04 09:41 zuoxinxue 阅读(562) 评论(0) 推荐(0)
浙公网安备 33010602011771号