Python编码之------Python下如何获取系统默认字符编码，(重点)案例：一个utf-8编码和unicode编码之间的转换实例。

@Python中最快捷的查看编码的方法，就是声明一个字符串字符串，然后看这个字符串的编码，如果和gbk对应，就是gbk编码，否则就是utf8。

例如：

>>> s='美国'
>>> s
'\xc3\xc0\xb9\xfa' #这里\xc3\xc0\xb9\xfa是gbk编码，证明系统默认编码是gbk

#!/usr/bin/env python
#coding=utf-8
#获取系统默认编码

import sys
print sys.getdefaultencoding()

该段程序在英文WindowsXP上输出为：

ascii

@例如，当前ide中的编码为utf-8，下边声明字符串，类型就是str格式

>>> s='我是谁'

>>> type(s)
<type 'str'>

>>> s.encode('utf-8') #这里，就会报错，因为s就是utf-8格式，不能对其再进行编码。

>>> s2= s.decode('utf-8') #这里不会报错，这里s2的值输出为u'\u6211\u662f\u8c01'(unicode编码)，print(u'\u6211\u662f\u8c01')输出结果为‘我是谁’

>>> u'我是谁'.encode('utf8') #这样才可以。只有unicode格式的字符串才编码为utf-8

------下边就可以，因为下边的s是unicode编码。

>>> s=u'我是谁'
>>> type(s)
<type 'unicode'>

>>> s.encode('utf8')
'\xc3\x8e\xc3\x92\xc3\x8a\xc3\x87\xc3\x8b\xc2\xad'

>>> t=s.encode('utf8')
>>> type(t)
<type 'str'>

posted on 2014-04-08 14:45 学到老死阅读(478) 评论(0) 收藏举报