C++字符集
C+实现支持一个基本的源字符集,即可用来编写源代码的字符集。它由标准美国键盘上的字符(大写和小写)和数字、C语言中使用的符号(如{和=)以及其他一些字符(如换行符和空格)组成。还有一个基本的执行字符集(通过执行程序来生成的字符),它增加了一些字符,如退格和振铃。C++标准还允许实现提供扩展源字符集和扩展执行字符集。另外,那些被作为字母的额外字符也可用于标识符名称中。也就是说,德国实现可能允许使用口耳曼语的元音变音,而法国实现则允许使用重元音。C++有一种表示这种特殊字符的机制,它独立于任何特定的键盘,使用的是通用字符名(universal character name)。
Unicode和ISO10646
Unicode提供了一种表示各种字符集的解决方案—为大量字符和符号提供标准数值编码,并根据类型将它们分组、例如,ASCII码成为Unicode的子集,因此在这两种系统中,美国的拉丁字符(如A和Z)的表示相同不过,Unicode还包含其他拉丁字符,如欧洲语言使用的拉丁字符、来自其他语言(如希腊语、西里尔语、希伯来语、阿拉伯语、泰语和孟加拉语)中的字符以及象形文字(如中国和日本的文字)。
到目前为止,Unicode可以表示96000多种符号和49个手写符号(script),它还在不断发展中。要了解更多有关的知识,请登录Unicode联盟的网站:www.unicode.org。
国际标准化组织(ISO)建立了一个工作组,专门开发ISO10646一这也是一个对多种语言文本进行编码的标准,ISO10646小组和Unicode小组从1991年开始合作,以确保他们的标准同步。

浙公网安备 33010602011771号