python 读取utf8文件

有时候默认是gbk编码,但是要读取utf8文件,所以会出现decode 错误。

使用codecs模块:

 

import codecs
file = codecs.open('filename','r',encoding='utf-8')

 

使用这个读取带有汉字的文件,如果是汉字,会整个读取进来,而不是按字节读取。读进来会自动转换成unicode。

posted on 2015-11-13 13:27  jxzheng  阅读(3821)  评论(0编辑  收藏  举报

导航