字符编码

人识别的语言与机器识别的语言转化的媒介

重点:什么是字符编码

           人类能识别的字符是高级标识符,电脑只识别01,要完成人与机器之间的信息交流,一定需要一个媒介,进行两种标识符的转化(两种标识符的对应关系)
对应关系形成的结构称之为:编码表

乱码:存数据与读数据采用的编码表不一致

 

软件打开文件读取数据的流程:

1、打开软件

2、往计算机发生一个打开文件的指令,来打开文件

3、读取数据渲染给用户(存取编码不一致:乱码)

python解释器打开py文件:

1、打开软件(python解释器)
2、往计算机发送一个打开文件的指令
3、逐行解释打开的文件内容(存取编码不一致,无法正常解释,崩溃)将执行的结果展示给用户

解释的原因:py2,默认按ASCII来解释文件内容,py3默认按utf-8来解释文件内容

Unicode与utf-8的关系:它们采用的是一张unicode的编码表utf-8是unicode编码表的体现方式,变长存储数据

变长优点:大量数据都是以英文存在,索引utf-8空间更小,传输速度快

 

编码与解码

重点:将u字符串编码成b字符串    u' '.encode()
           将b字符串编码成u字符串    b' '.decode()

 

文件操作

     计算机中的文件:硬盘中一块存储空间(虚拟的文件)
     文件操作:根据文件名来操作硬盘的那块存储空间

     操作方式:读: read      写:write
一、使用文件的三步骤

1.打开文件

变量名=文件空间

文件路径  操作模式(读写)编码
2.操作文件

读()、写()
3、关闭文件*****

f.close

二、模式

基础写:文件不存在,会新建文件,文件存在,则会先清空文件再操作文件