关于一个汉字占了多少个字节


要看编码形式啊

GBK编码,一个汉字是占两个字节。

UTF-16编码,通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16)。

UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节。


而一般说的字符,默认是指英文字符,一个汉字占用两个英文字符。

所以总有人说一个汉字占两个字节是不准确的

posted @ 2020-06-01 18:21  然终酒肆  阅读(1663)  评论(0)    收藏  举报