ASCII 码使用指定的8 位二进制组合来表示256 种可能的字符。

8 bit== 一个字节(byte)

1024 byte == 1 KB

1024 KB ==1 MB

1024 MB ==1 GB

1024 GB ==1 TB

但是中文有9万多个字,ASCII码只有256个可能,为了解决全球化的文字问题,创建了一个unicode。

1个字节表示所有的英文,特殊字符,数字等等

两个字节,16位表示一个中文,不够,unicode一个中文用四个字节表示,32位表示一个中文,但是这种情况比较浪费,不需要四个字节就能表示全部的中文汉字。

因此,升级到utf-8,一个中文三个字节表示。

gbk-中国人自己创建的,国内使用,一个中文用2个字节。