对于语言和文字的论证(第五版)

语言:指发音。

文字:指文字。

手语(手势)属于语言吗?不算,算做动作。就像“机器人”不属于“人”,“手语”也不属于“语”。

内地使用的文字:

书写格式:规范汉字

文法:白话文

内地使用的语言:

发音:普通话

语法:普通话

低劣的文字翻译会出现这种问题:规范汉字+外国文法。

如果一个文字资料网站,有2种内容:

“它是一个刮胡刀”这种内容,假设用example.com/zh-Hans-CN/
“佢系一个须刨嚟嘅”这种内容,假设也用example.com/zh-Hans-CN/

这明显是2种文法,目标用户不一样,不该用同一个地址。

下面这种方案:

“它是一个刮胡刀”这种内容,假设用example.com/cmn-Hans-CN/
“佢系一个须刨嚟嘅”这种内容,假设用example.com/yue-Hans/

cmn-Hans-CN表示“普通话-规范汉字-中国”

yue-Hans表示“粤语-规范汉字”

有一个用户不会说普通话,但他能看懂“它是一个刮胡刀”,那他应该进入example.com/cmn-Hans-CN/吗?这不是普通话频道吗?

为什么一个用户不会说普通话,却能看懂“它是一个刮胡刀”?

假设,某教师不会普通话,教学生识字,用本地发音,就会出现这种情况。

这个用户能看懂“它是一个刮胡刀”,表示他认识规范汉字,同时理解白话文文法。维基百科的资料显示:白话文,亦作语体文,是指以民国时期官话口语为基础,经过加工的书面语。所以合理的用法应该是“白话文-规范汉字”,cmn表示“北方话、白话”,所以cmn-Hans-CN可以表达。

可以得出这样的结论,文字不能独立于语言而存在。白话文运动后,中国文坛强调“我手写我口”、“能识字便能读文”的白话文。“白话文”这个词就表明了这个意思——有“话”再有“文”。

在2007年的国际标准 ISO 639-3中,认定汉语文(zh)是一个大语文(macrolanguage),包含13种语文,cdo – 闽东语,cjy – 晋语,cmn – 北方话,cpx – 莆仙语,czh – 徽语,czo – 闽中语,gan – 赣语,hak – 客家话,hsn – 湘语,mnp – 闽北语,nan – 闽南语,wuu – 吴语,yue – 粤语。

ISO 639-3标准地址:http://www.sil.org/iso639-3/documentation.asp?id=zho

应该使用zh-cmn-Hans-CN还是cmn-Hans-CN?

W3C指出:语言文字由IETF的BCP 47规范规定,BCP 47是由一系列会更新的标准组成。

http://www.w3.org/International/articles/language-tags/

BCP 47规范地址:http://www.rfc-editor.org/rfc/bcp/bcp47.txt

BCP47规定应使用zh-cmn而不是cmn。

原文如下:

   For example, the macrolanguage Chinese ('zh') encompasses a number of
   languages.  For compatibility reasons, each of these languages has
   both a primary and extended language subtag in the registry.  A few
   selected examples of these include Gan Chinese ('gan'), Cantonese
   Chinese ('yue'), and Mandarin Chinese ('cmn').  Each is encompassed
   by the macrolanguage 'zh' (Chinese).  Therefore, they each have the
   prefix "zh" in their registry records.  Thus, Gan Chinese is
   represented with tags beginning "zh-gan" or "gan", Cantonese with
   tags beginning either "yue" or "zh-yue", and Mandarin Chinese with
   "zh-cmn" or "cmn".  The language subtag 'zh' can still be used
   without an extended language subtag to label a resource as some
   unspecified variety of Chinese, while the primary language subtag
   ('gan', 'yue', 'cmn') is preferred to using the extended language
   form ("zh-gan", "zh-yue", "zh-cmn").

zh是啥意思呢?表示“汉语”还是表示“汉字”?也许表示“汉语文”。

对语言和文字的探讨:http://www.cnblogs.com/sink_cup/tag/lang/

语言:指发音,即spoken language。如:普通话(国语)、粤语、英语、日语。
文字:指文字,即written language。如:规范汉字、英文、日文。
语文:发音或文字,即language。
《中华人民共和国国家通用语言文字法》第二条:本法所称的国家通用语言文字是普通话和规范汉字。
西方简称“中国文字”为“中文”。在中国内地的法律中不出现“中文”这个词,没有这种用法。在香港地区的法律中出现了“中文”这个词,《中华人民共和国香 港特别行政区基本法》第九条:香港特别行政区的行政机关、立法机关和司法机关,除使用中文外,还可使用英文,英文也是正式语文。
台湾地区有语言文字的规定,比如《常用國字標準字體表》、《次常用國字標準字體表》與《罕用字體表》 《語言文字基本法》等。
ISO 639和ISO 3166约定语文名称使用小写,地区代码使用大写。大小写是一个推荐使用的惯例,并不是强制要求;语文代码是不区分大小写的。

语言标记:spoken_language_tag
zh-cmn 普通话或国语
zh-yue 粤语
en-US 英语(美国)

文字标记:written_language_tag
zh-cmn-Hans-CN 规范汉字
zh-cmn-Hant-TW 国字
en-US 英文(美国)

目前,不少软件都支持 多语言+多文字。
比如 电影:可以选择 音轨(即语言)和字幕(即文字)。
比如 星际争霸2 台湾版:国语 + 国字;美国版:英语 + 英文。

所以大家做i18n的软件,要注意语言和文字是2个概念。
开发时注意严谨,不要轻易使用language,因为不能确定language是表示语言还是文字。万一以后要做多声音的app呢?比如avast。
大部分国际化的软件是多文字界面的,在程序中应使用written_language_tag。

posted @ 2011-04-15 10:21  sink_cup  阅读(1157)  评论(0编辑  收藏
Creative Commons License

本站原创作品采用知识共享署名 3.0许可协议进行许可。