字符编码

1、ASCII  ( 28-1个字符   已使用127个字符)

2、1980年,从ASCII中引用一部分拓展至另一个类似的表格中,为GB2312,内含7000多汉字

3、1995年,从GB2312中拓展为GBK1.0,内含20000以上汉字

4、2000年,从GBK1.0拓展成GB18030,内含27000以上汉字

5、统一所有国家编码为Unicode,也称其为统一码、万国码、单一码(占用16个bIt)

6、由于Unicode所占空间过大,出现其子集,UTF-8(可变长);存英文时,保存为ASCII,占一个字节;存中文时,保存为UTF-8,占3个字节

 

具体关系如下图:

ASCII   2**8-1   1bytes

  -->1980年 GB2312 7000+汉字

    -->1995年 GBK1.0  20000+汉字

      -->2000年 GB18030 27000+汉字

    -->Unicode  2bytes

        -->UTF-8   English:1bytes    Chinese:3bytes

posted @ 2018-01-23 17:01  Hu·Mei  阅读(118)  评论(0编辑  收藏  举报