第五篇:字符编码

一.知识储备

1.1计算机运行跟哪几个核心的硬件有关

cpu 运行程序
内存  临时存储数据
硬盘  永久存储数据

硬盘里面notepad++的指令读到内存，内存会专门申请一个空间，空间给notepad++这个文本编辑器来用，cpu通过来调notepad++来处理

1.2文本编辑器存原理

结论：在编写py的程序的时候，是没有语法的限制的，编辑的结果跟编写一个普通的文本文件是没有任何区别，只有把py程序交给python解释并且在运行的第三个阶段才有了语言意义。

1.3.python解释器执行python程序的原理

python3  test.py
第一阶段：先启动python解释器这个软件
第二阶段：把test.py文件的内容读入内存
第三阶段：解释执行，识别语法

1.4.文本编辑器读原理

第一阶段:先启动文本编辑器
第二阶段:把文本文件的内容读入内存
第三阶段:把文件里面的内容打印到屏幕

二.字符编码

计算机读懂人类字符必须经过一个过程:
#字符--------（翻译过程）------->数字 
#这个过程实际就是一个字符如何对应一个特定数字的标准，这个标准称之为字符编码

2.2什么是字符编码表?

翻译的过程必须遵循一个标准:字符与数字一一对应的关系,这个标准称之为字符编码表。

2.3字符编码的分类

ASCII
8bit=1bytes,一个英文字符占用1字节

GBK
16bit=2bytes ，2个字节表示一个中文字符，1字节表示一个英文字符

unicode(内存中固定的编码)：
16bit=2bytes,2个字节表示一个字符

utf-8:Unicode Transformation Format(utf-8也称为unicode的转换版本)
    1字节表示一个英文字符,3bytes表示一个中文字符

2.4保证不乱码的核心是什么?

文件是以什么编码存的，就必须以该读取
强调：我们能控制的只是存到硬盘上的编码

python3解释器：默认utf-8编码
python2解释器：默认ascii编码

文件头的作用：#coding:utf-8 是告诉python解释器，用我指定的字符编码

2.5执行python程序三个阶段发生的事

会识别python语法，定义的字符串类型又涉及到字符编码的概念
x='上' #x=str('上')
python2:
    字符串分为两种形式:(str和unicode)
        x='上' #python2的str类型会按照文件头指定的编码来存‘上’    (#coding:utf-8)

python3：
    str：被存成了unicode

2.6字符编码发展的三个阶段

2.7转换

unicode---编码encode--->gbk
gbk------->解码decode---》unicode

posted @ 2018-12-28 20:32 王苗鲁阅读(94) 评论(0) 收藏举报

刷新页面返回顶部

霸道总裁

第五篇:字符编码

一.知识储备

1.1计算机运行跟哪几个核心的硬件有关

1.2文本编辑器存原理

1.3.python解释器执行python程序的原理

1.4.文本编辑器读原理

二.字符编码

2.2什么是字符编码表?

2.3字符编码的分类

2.4保证不乱码的核心是什么?

2.5执行python程序三个阶段发生的事

2.6字符编码发展的三个阶段

2.7转换

公告