Python 乱码问题解决办法

乱码产生的原因是Python在读取时默认解码方式是用操作系统编码,如果和保存时的编码方式不一样，就会出现乱码

比如以下片段，文件保存格式是utf-8

#coding=utf-8
print '是' #输出乱码

因为windows默认的编码方式是GBK，python文件保存时使用了utf-8,在读取时,python使用GBK的编码表去解utf-8编码的字节码，因为GBK与UTF-8编码不兼容，自然出现了乱码问题

解决方法：

1.直接使用 u'是' 形式，指明以unicode编码,解码方式会以顶部 #coding定义的编码方式，如果不写，以操作系统当前编码方法，建议写上#coding，因为要让操作系统编码和源文件编码经常会不一样。推荐使用这种方式

2.输出时指定解码方法 print '是'.decode("utf8") ，必须和保存的编码一致,忽略#coding的定义

3.将#coding 和保存编码改为和操作系统一样的编码，就可以直接print '是' 正常输出，也不推荐，因为需要事先知道操作系统编码，复制到其他电脑上，操作系统编码不一样就会出错

#coding=gbk
print u'是' #方法1
print '是'.decode("gbk") #方法2
print '是' #方法3

注意：

#coding指明的编码必须和保存的编码一样，不然1,3方法都会产生错误，原因也是保存编码和读取编码不一致。一般IDE能够自动根据#coding保存文件

posted @ 2013-04-06 20:13 Bug山Bug海阅读(18243) 评论(0) 收藏举报

刷新页面返回顶部