python爬虫之百度贴吧
摘要:第一步:通过urllib2,Request命令和urlopen命令爬取贴吧网页源码,并通过这则表达式,选取自己想要的数据 在这里需要注意几个地方 1.编码问题,这里对中文编码不再进行过多阐述。 网页源码是utf-8,我在编写程序前# -*- coding:utf-8 -*-,那么显示在网页上,我只需
阅读全文
posted @ 2017-07-31 16:54
posted @ 2017-07-31 16:54
posted @ 2017-07-13 17:11