@Python中最快捷的查看编码的方法,就是声明一个字符串字符串,然后看这个字符串的编码,如果和gbk对应,就是gbk编码,否则就是utf8。
例如:
>>> s='美国'
>>> s
'\xc3\xc0\xb9\xfa'  #这里\xc3\xc0\xb9\xfa是gbk编码,证明系统默认编码是gbk
#!/usr/bin/env python
#coding=utf-8
#获取系统默认编码
import sys
print sys.getdefaultencoding() 
该段程序在英文WindowsXP上输出为:
ascii
@例如,当前ide中的编码为utf-8,下边声明字符串,类型就是str格式
>>> s='我是谁'
>>> type(s)
<type 'str'>
>>> s.encode('utf-8') #这里,就会报错,因为s就是utf-8格式,不能对其再进行编码。
>>> s2= s.decode('utf-8') #这里不会报错,这里s2的值输出为u'\u6211\u662f\u8c01'(unicode编码),print(u'\u6211\u662f\u8c01')输出结果为‘我是谁’
>>> u'我是谁'.encode('utf8') #这样才可以。只有unicode格式的字符串才编码为utf-8
------下边就可以,因为下边的s是unicode编码。
>>> s=u'我是谁'
>>> type(s)
<type 'unicode'>
>>> s.encode('utf8')
'\xc3\x8e\xc3\x92\xc3\x8a\xc3\x87\xc3\x8b\xc2\xad'
>>> t=s.encode('utf8')
>>> type(t)
<type 'str'>
                    
                
                
            
        
浙公网安备 33010602011771号