【ZT】关于字符集

utf8 全包容了gbk ,并不是说超集和子集;
8i 的数据库 的 utf8 是  4位定长的字符编码;
9i 和以上数据库的utf8   有4位定长AL32UTF8和  不定长的  UTF8  ,都是unicode编码;
其中,utf8 编码中 字符大多是三字节的编码,一个汉字是  3字节的编码;
zhs16gbk  并不是unicode 编码,只是提供了对gbk汉字编码的支持, 一个汉字为双字节;
utf8  对于 zhs16gbk  中的所有编码都有唯一的编码以之对应,所以我说utf8 全包容了bgk;
当然,utf8作为一种unicode 编码,他还提供  global character  的支持;
假如设置得当,从  zhs15gbk 到utf8  是可以实现无损耗的字符转换的;
本人从事汉字冷僻字处理相关的工作,对此还是比较了解的;

posted @ 2017-04-13 09:35  likingzi  阅读(177)  评论(0编辑  收藏  举报