BeautifulSoup的一点使用小结(一)
最近在学习用Python采集,接触到BeautifulSoup。
BeautifulSoup是用 Python 写的一个 HTML/XML 的解析器,它可以很好的处理不规范标记并生成剖析树。
from BeautifulSoup import BeautifulSoup from BeautifulSoup import BeautifulStoneSoup import urllib2 url=“xxxxxxxxxxxxxx” content = urllib2.urlopen(url).read() soup = BeautifulSoup(content,fromEncoding="gb18030")#GBK网站载入gb18030 解决乱码
下面就开始用BeautifulSoup进行所需内容采集。
未完待续。。


浙公网安备 33010602011771号