Fork me on GitHub

一个汉字占多少字节?

GBK编码,一个汉字占两个字节。

UTF-16编码,通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16)。

UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节。


作者:stevenliuyi
链接:https://www.zhihu.com/question/20451870/answer/15168034
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
posted @ 2018-04-20 18:01  猫叔Vincent  阅读(3143)  评论(0编辑  收藏  举报