BeautifulSoup的一点使用小结(一)

最近在学习用Python采集,接触到BeautifulSoup。

BeautifulSoup是用 Python 写的一个 HTML/XML 的解析器,它可以很好的处理不规范标记并生成剖析树。

from BeautifulSoup import BeautifulSoup
from BeautifulSoup import BeautifulStoneSoup 
import urllib2

url=“xxxxxxxxxxxxxx”

content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content,fromEncoding="gb18030")#GBK网站载入gb18030 解决乱码

下面就开始用BeautifulSoup进行所需内容采集。

 

未完待续。。

posted @ 2013-08-30 17:29  流氓耗子  阅读(414)  评论(0)    收藏  举报