有时候默认是gbk编码,但是要读取utf8文件,所以会出现decode 错误。
使用codecs模块:
import codecs file = codecs.open('filename','r',encoding='utf-8')
使用这个读取带有汉字的文件,如果是汉字,会整个读取进来,而不是按字节读取。读进来会自动转换成unicode。
posted on 2015-11-13 13:27 jxzheng 阅读(3821) 评论(0) 编辑 收藏 举报