1、ASCII名词解释

  ASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号

2、Unicode名词解释

  Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布

3、UTF-8名词解释

  UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。

4、编码的转换

在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。

用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:

 

5、python中的字符串

python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)

# vim 2.py
#!/usr/bin/env python
print 'python,你好!'
#python 2.py
File "2.py", line 3
SyntaxError: Non-ASCII character '\xe4' in file 2.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

在文件中指定编码

1 # vim 2.py
2 #!/usr/bin/env python
3 #-*- coding:utf-8 -*-    
4 print '你好,python'
5 # python 2.py
6 你好,python

 

posted on 2015-10-30 10:10  冰下急流  阅读(52)  评论(0)    收藏  举报