Python中的字符编码

Python解释器启动后，相当于启动了一个文本编辑器，读取文件中的内容到内存中。但与文本编辑器不同的是，Python解释器的目的不是为了显示文件内容，而是一条一条执行文件中的内容

计算机只认识数字0和1。人类使用的字符信息在计算机中就是以数字0和1进行存储的。所以，人类文字和计算机文字之间需要通过某以规则进行转换，这就是字符编码的作用。

字符编码就相当于一本密码本一样。没有密码本，人类是无法把计算机的数字0和1转换成其可以读懂的文字。

各个国家的文字不一样，所以会有不一样的“密码本”。如果用错“密码本”来解码，那么，就会出现“乱码”现象

unicode——兼容万国的编码，即“超级密码本”

UTF-8（Unicode Transformation Format-8）

简单的说，unicode是一个精通世界各国语言的大师。大师在记录时，用自己的一套专用密码本utf-8，简单、高效。

utf-8这本密码本兼容世界万国语言，但却各个国家自己的密码本不兼容。和各个国家密码本兼容的是unicode。

注意：内存中使用的是unicode，历史遗留问题……

用什么编码存（encode)就用什么编码解(decode)，推荐使用utf-8

posted on 2019-05-27 19:55 heroknot 阅读(159) 评论(0) 收藏举报