最近在网上发现,尽然不少人将 GB2312-80 编码和 GBK 编码等同起来,认为某汉字若均存在这两种编码,则其值必定相等。
本人自多方面考证,现将个人的认识书写如下:
GB2312 码是中华人民共和国国家标准汉字信息交换用编码,全称《信息交换用汉字编码字符集 基本集》,标准号为 GB 2312-80。习惯上称为国标码或 GB 码。
GBK 是也一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称 Chinese Internal Code Specification 。习惯上称为机内码。
GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1 国际标准。其实这里所谓的与 GB 2312 编码向下兼容是指编码顺序的兼容,而不是编码值的兼容。即 GBK 收录了 GB2312 中的所有字符,并按原顺序排列,但字符的编码值不同于原来的编码值。所以汉字字符的 GBK 的编码值不等于 GB2312 编码值。由于字符的排列顺序不变,所以它们的换算规则也很简单。GB2312 编码换算成 GBK 编码只要高低位各加上 80(H) 就行。
浙公网安备 33010602011771号