编码
ASCII码占8位,1个字节,可以表示28=256个字符,放不了中文
就有了GBK占16位,2个字节,可以表示216=65536个字符,中文有9万多也不够
就有了Unicode(万国码)是32位,可以表示2**32=4294967296个字符,用不了,浪费空间
UTF-8:每个字符最少占8位,每个字符占用的字节数不一样,
字母a
ascii:01100001
gbk:00000000 01100001
unicode:00000000 00000000 00000000 01100001
utf-8(可变长度的unicode):01100001
英文 8bit 1个字节
欧洲文字 16bit 2个字节
中文 24bit 3个字节
8 bit=1 byte
1024 byte = 1KB
1024 KB = 1MB
1024 MB = 1GB
1024 GB = 1TB
1024 TB = 1PB
浙公网安备 33010602011771号