day 08文件与字符编码

Posted on 2019-01-08 18:41  九块九  阅读(85)  评论(0)    收藏  举报

ASCII  一个字符占一个字节

GBK 中文使用两个字节,英文使用1个字节,使用开头一个比特位标识是英文还是中文

unicode:支持任何国家的语言,全部字符都是使用两个字节

utf-8 一个英文占用一个字节, 中文占用3个字节

encode :就是将unicode--------->翻译--------->某种指定格式的二进制如utf-8

decode:将某种指定格式的二进制------>翻译------->unicode

修改文件:

因为文件是存储在硬盘上面的无法直接进行修改,必须先将硬盘里面的内容完全读出来,然后再讲修改后的文件写入

两种方式:

  1.先将所有的文件全部读出来,然后将修改后的文件一次性再全部写回文件 缺点:过多的占用内存

  2.先将文件内容读出一行,修改完成后.里面写入新的文件当中      缺点:频繁的I/0操作