编码格式

三种编码格式:

       最原始:  ASKII: 只能表示128个字符; 

                    为什么是128?

                    计算机内存的最小单位是字节, 一个字节是八位二进制. 为什么是二进制, 因为电信号最有效的传递方式就是正负传递. 

                    为什么是八位, 谁规定的? 美国人, 当初计算机储存诞生时候就这么定义的, 网络通信中物理层以太网协议规定传输最小单位也是八位二进制;

                    128是因为八位数,当时觉得用不到就留着第一位空着,每个数都能显示两种状态, 排列组合为2的七次方.

              可能无数中国人在骂祖宗,为什么中国祖先没有发明计算机

       一统江湖: Unicode编码

               128个字符显然不够其他国家用, 为了适应全球, Unicode这种编码诞生.

               每个符号长度为3个字节. 

               但是还是不很好,有些原先能够一个字节表示的字符,用三个字节表示, 内存占用大了两倍.

       优化: utf-8

              可变字节, 有自己的排列原则, 适合大规模的处理数据.

        

                    

posted @ 2019-04-12 12:27  当当和瓶瓶  阅读(293)  评论(0编辑  收藏  举报