@Python中最快捷的查看编码的方法,就是声明一个字符串字符串,然后看这个字符串的编码,如果和gbk对应,就是gbk编码,否则就是utf8。

例如:

>>> s='美国'
>>> s
'\xc3\xc0\xb9\xfa'  #这里\xc3\xc0\xb9\xfa是gbk编码,证明系统默认编码是gbk

 

#!/usr/bin/env python
#coding=utf-8
#获取系统默认编码

import sys
print sys.getdefaultencoding()

该段程序在英文WindowsXP上输出为:

ascii

 

@例如,当前ide中的编码为utf-8,下边声明字符串,类型就是str格式

>>> s='我是谁'

>>> type(s)
<type 'str'>

>>> s.encode('utf-8')  #这里,就会报错,因为s就是utf-8格式,不能对其再进行编码。

>>> s2= s.decode('utf-8')  #这里不会报错,这里s2的值输出为u'\u6211\u662f\u8c01'(unicode编码),print(u'\u6211\u662f\u8c01')输出结果为‘我是谁’

>>> u'我是谁'.encode('utf8')   #这样才可以。只有unicode格式的字符串才编码为utf-8

------下边就可以,因为下边的s是unicode编码。

>>> s=u'我是谁'
>>> type(s)
<type 'unicode'>

>>> s.encode('utf8')
'\xc3\x8e\xc3\x92\xc3\x8a\xc3\x87\xc3\x8b\xc2\xad'

>>> t=s.encode('utf8')
>>> type(t)
<type 'str'>

posted on 2014-04-08 14:45  学到老死  阅读(478)  评论(0)    收藏  举报