字符集与编码方式

字符集

字符集(Character Set)是一个系统的、标准化的字符集合,它为每个字符分配唯一的数字编号(称为码点,Code Point)。简单来说,字符集就是字符与数字的映射表。

常见的字符集:

  • unicode
  • ASCII
  • GB2312:中文区域使用

字符集与对应的编码方式

  • unicode字符集对应的编码方式:UTF-8、UTF-16、UTF-32。
  • GBK字符集对应的编码方式:GBK

总结

字符集定义了码点与实际字符的对应关系,编码方式决定了以什么样的方式将字符集的码点保存到硬盘中。比如UTF-8采用的是可变(1~4 字节)保存UNICODE的码点。

posted on 2024-11-20 11:17  zhaoLei_Free  阅读(68)  评论(0)    收藏  举报

导航