Python中的字符编码

Python解释器执行py文件的原理

Python解释器启动后,相当于启动了一个文本编辑器,读取文件中的内容到内存中。但与文本编辑器不同的是,Python解释器的目的不是为了显示文件内容,而是一条一条执行文件中的内容

什么是字符编码

计算机只认识数字0和1。人类使用的字符信息在计算机中就是以数字0和1进行存储的。所以,人类文字和计算机文字之间需要通过某以规则进行转换,这就是字符编码的作用。

字符编码就相当于一本密码本一样。没有密码本,人类是无法把计算机的数字0和1转换成其可以读懂的文字。

各个国家的文字不一样,所以会有不一样的“密码本”。如果用错“密码本”来解码,那么,就会出现“乱码”现象

unicode和utf-8

unicode——兼容万国的编码,即“超级密码本”

UTF-8(Unicode Transformation Format-8)

简单的说,unicode是一个精通世界各国语言的大师。大师在记录时,用自己的一套专用密码本utf-8,简单、高效。

utf-8这本密码本兼容世界万国语言,但却各个国家自己的密码本不兼容。和各个国家密码本兼容的是unicode。

注意:内存中使用的是unicode,历史遗留问题……

关键

用什么编码存(encode)就用什么编码解(decode),推荐使用utf-8

posted on 2019-05-27 19:55  heroknot  阅读(139)  评论(0编辑  收藏  举报