摘要:
python中编码问题是一个必然会遇见的问题,尤其是中文编码,一不小心就出现乱码。为此,一个绝对不能绕过的模块codecs, 可以看出python对编码这块的支持甚是强大。另有附带codecs代码示例的博文,顺着文章一通敲下来,python中的编码问题自然就不是问题了.在使用python写一个简单爬虫的过程中,我遇见一个相关问题,也算是比较奇葩了,瞎折腾了一晚上才算是解决。本来抓取网页内容编码是 "GB2312", 传入值以后使用decode('gb2312', 'ignore')后解码为unicode,再使用Beautiful Soup进行 阅读全文
posted @ 2012-07-31 23:38
Alex_Waiter
阅读(2860)
评论(2)
推荐(0)

浙公网安备 33010602011771号