SUMTEC -- There's a thing in my bloglet.

But it's not only one. It's many. It's the same as other things but it exactly likes nothing else...

  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  205 随笔 :: 19 文章 :: 1627 评论 :: 9 Trackbacks
不是说编程语言,是说真实的语言。为什么说这个东西?因为最近正好看到Google有“克林贡语首页”的链接,什么是克林贡语呢?居然是人类为了拍一系列电影创造出来的“外星”语言,除了世界语之外的另一种人造语。而且更令人称奇的是,有好多影迷非常投入,把这个语言发扬光大,互相交谈就用这个语言。这个语言还专门出了教材,在Google上搜索这个语言,居然发现还有翻译公司做这种语言的翻译,莎士比亚的著作也被翻译成这种语言。真是太强了!

为了营造“陌生感”,这种语言使用了人类语言中最最少见的语序“宾谓主”,比如说“我爱你”就得说成是“你爱我”了。这就一下子引起我的兴趣了:为什么“宾谓主”这种语序是最少见的?带着这个问题在Google上面搜索了一圈,居然没有找到这个问题的答案。顺带搜索了一下各种语序在人类语言当中所占的比例,原来“主宾谓”才是用的最多的语言,其次是“主谓宾”,接下来是“谓主宾”,其他的貌似都是比较少见的。为什么是这样一个状况呢?
 
搜出来的很多研究都是研究某种语言的语法结构,但是为什么特定语言会出现特定的语序,则几乎没有找到。所以我正好有点空间可以发挥一下自己的想象力。

首先说克林贡语言的“宾谓主”语序结构,我的第一个想法就是“我爱你”得要说成“你爱我”了。这个时候我突然觉得,如果我们汉语是这样一种顺序,很多电影的尴尬场景根本就没有办法呈现。为了避免混淆,用英语写的就表示是克林贡语。
想象一下,我们经常看到一个男的喜欢一个女的,话到嘴边说不出来:“我……我……想出去走走”,或者:“我……我……爱……看电视,你呢?”。如果用克林贡语说,就变成“you……you……”,看你那个尴尬的样子,十有八九就想说“you love me(我爱你)”。总不能是“you kick I(我踢你?那么没有逻辑的话?)”,或者“you watch television(电视看你?)”这样的话吧?
看来宾谓主的语序情况下,在特定场景要撒谎太难了!人总是嘴比心快,一不小心就会把心里的话说出来,至少说出几个字之后才意识到。这个时候要想转过弯来,除了靠技巧,还需要语法结构的配合了。通常来讲,一句话占含义最重的,不是行为,就是目标。主体通常很好从上下文里面猜测出来,比如有人问你“你喜欢谁?”。不用说,主语肯定是“我”。如果用克林贡语回答这个问题,第一个词就把答案给揭露了,后面的"love I"两个词毫无意义。当然了,你用汉语还是英语,也可以直接回答宾语,比如说“你”。但是如果你不想回答这个问题但又不得不回答的时候,这个时候就需要思考,同时需要说点什么来掩饰这个思考的过程,比如说“我……喜欢……妈妈!”
很显然,克林贡语无法完成这样的任务。

其实说到语言的语序结构,并不是说一种语言只有一种语序。拿一个“你吃饭了吗?”来说,也可以说“你饭吃了吗”、“饭你吃了吗”、“吃饭了吗你”、“饭吃了吗你”,几乎涵盖了所有的语序(除了“吃了吗你饭?”)。可以说,只要是没有歧义,几乎所有语序都可以使用。但是,总有一种是最为常用的。最为常用的不是“主谓宾”,就是“主宾谓”。为什么?
前面的说谎目的,我觉得是其中一个比较可能的原因。

再说“主宾谓”,竟然占所有语言中的45%!“谓主宾”占18%,剩下的37%估计几乎都是“主谓宾”结构语言了。我总觉得“主宾谓”这种结构占多数是很不可思议的一件事情,也许我们汉语主要用“主谓宾”结构吧。但是转念一想,这个是按照数量来衡量的,而如果按照流行程度来衡量,恐怕“主谓宾”才是真正的主流。除了汉语之外,英语、西班牙语、葡萄牙语、阿拉伯语等基本都是主谓宾结构的语言。这说明这种结构还是有它的优势的,优势在哪里呢,或者说为什么主流世界会是主谓宾结构呢?我找不到答案。
还是举例来分析一下吧,“昨天小李告诉我小张看见小王在揍小赵。”准确一点的分解应该是:
(主语)小李  (谓语)告诉 (间接宾语)我 (直接宾语短句,一件事情)(主)小张 (谓)看见  (宾,一件事情)(主)小王在(谓)揍(宾)小赵

很明显,主要的意思是,小李告诉我一件事情,这个句子的中心在最开始就已经说清楚了。如果是主宾谓呢,估计就变成了:
小李 我 {(一件事情) 小张 [(一件事情)小王 小赵 在揍] 看见 }  告诉
抽掉那些为了让你我好理解的话括号和解释词,这句话就变成了:
小李我小张小王小赵在揍看见告诉

天啊!这要理解起来真费了劲了!当然,真正的主宾谓肯定不能这么说,整句话肯定得要拆开来说:
小李我告诉一事,小张一事看见,小王小赵在揍
我们把一事压缩掉,可以说是:
小李我告诉,小张看见,小王小赵在揍


于是我们可以看见,原本的一句话不得不拆开来,或者至少要引入一些复杂结构来支撑。而且后半部分的“小张看见小王小赵在揍”,我们如果把“小王小赵在揍”当作是宾语,这句话就又变成主谓宾结构的“小张看见一件事情”了。可见主宾谓在特定情况下很容易就会被压缩成“主谓宾”结构,既然如此,如果都是主谓宾结构,就不需要引入额外的语法结构和“拆箱装箱开销”了。我可以想象,上述的压缩肯定不是实际应用的语言,实际应用的可能会类似:
小李我告诉呢,小张看见的说,小王小赵在揍。

上面的“呢”,“的说”就是一种辅助语法结构词。我看了一个讲韩语的帖子,就说有类似的结构,比如:
“점심”就是“午饭”后边的“”表示점심在这里是宾语。
테레비전봤어요테레비전电视机television是也。后边的봤어요是“보 + 았(表示过去的)+ 어요”就是“看+了”后边在加上一个“的说”。整句话就是“电视看了的说”。

你看,有表示宾语的词,也有表示语法结构的“的说”,这就是“主宾谓”的额外开销。(当然,属于个人猜测,本人不是研究这个方面的,也没有咋研究过。)

汉语和英语就几乎没有这类的结构,即使有也是可有可无,去掉也不影响理解的。因此我们是否可以合理猜测认为,人类使用语言更重要的一件事情是进行有效率的沟通。如果一种语言的语法结构在沟通复杂事务的时候存在效率问题,那么这个语言就可能逐渐的被更有效率的语法结构所代替。如果我们只是讨论“我爱你”这种简单的话,无论哪一种语序,都能够很有效的进行沟通。但是如果是刚才那一句“昨天小李告诉我小张看见小王在揍小赵。”,不同的语法结构在方便人进行理解的情况下,就会有不同的效率表现。我认为这样的假设可能是有理由的,比如我们看英语的演变:古英语是存在大量的“主宾谓”结构的。还是刚才提到的那一片博客,里面就有一个"I thee wed"的例子(我娶你)。那么为什么现代英语却大量的采用“主谓宾”结构呢?有一个比较可能的原因,就是随着科技的发展,随着英语世界的不断扩大,需要表达的东西越来越复杂了,继续使用“主宾谓”结构来表达事情会有越来越多的麻烦。而且刚才也看到了,“主宾谓”结构的长句子经过压缩之后,会在局部呈现出一种“主谓宾”结构,因此最终从“主宾谓”演化成“主谓宾”就是很自然的事情了。

另一间让我诧异的事情是,“谓主宾”这种语法结构的语言,竟然占18%!还是用刚才那句很长的话做例子,估计就变成了:
告诉 小李 我 {(一事)看见 小张 [(一事) 在揍 小王 小赵] }

压缩一下变成:
告诉小李我看见小张在揍小王小赵。

看着混乱,其实很容易理解,一个动词后面跟一个主语和一个宾语,或者一个动词后面跟一个主语和一个直接宾语和一个间接宾语。如果发现在宾语的地方遇到动词了,则肯定是一个从句。比如告诉后面是主语小李,然后是间接宾语我,接下来遇到看见,说明看见的事情是一个从句,整个从句式告诉的直接宾语。从句里面动词看见后面是主语小张,接着是一个动词在揍,也说明在揍所描述的事情是看见事情的宾语。

没有想到吧!“谓主宾”结构竟然比“主宾谓”结构更容易让人理解,我想这就是为什么“谓主宾”这种奇怪的语序竟然也占有这么大的市场的原因了。“谓主宾”之所以排在第三名,也一定有它的理由的。我的“说谎论”也能够解释这件事情——第一个词就已经把最重要的信息暴露出来了,想要说谎相对会有难度。还是回到电影场景里面,男孩想跟女孩说“我……爱……你!”。如果你用的是“谓主宾”,说了第一个字就后悔了,结果会是什么呢?“爱……我……西红柿!”看起来比“宾谓主”这种语言要好点,但怎么也比不上“主谓宾”或者“主宾谓”,这两种语言能够更自由的进行发挥。就拿正经的汉语来说吧:“我……想今天的天气还真不错!”女孩子听了这句话,就算猜到了有可能说得是“我爱你”,也不敢确定。

为什么我会拿“说谎”来说事呢?因为语言有一个很重要的功能,是让弱者互相沟通,协力击败强者。很多时候,强者总是试图维护旧有的秩序,并且总是试图维护强者自己的权益。有的时候个体有利并不见得对整体是有利的,比如说打劫对强盗个人是有利的,但却有损于整个社会。一个没有语言的世界,最强悍的人就可以随意欺负弱者。很简单,一个弱者想要出来反抗,如果不能够得到其他人的支持,显然是会失败的。如果你无法确认有人来帮你,而你自己的实力有不足够强大,自然是少惹事微妙。所以语言的出现能够破坏强者恒强的规则,也就能够破除旧有秩序,建立更加有利于整体的新秩序。

但是既然大家都会一种语言,在弱者密谋篡夺强者王位的时候,强者也同样可以逼问或者试探某一个弱者,以此瓦解整个图谋。这个时候“说谎”就变得很重要了。其实说谎在很多时候,也是个体谋取利益的一种手段。如果说一种语言不利于说谎,很难想象这种语言能够被大家接受。或者当你想要说谎的时候,就会不自觉地改变语言的顺序。

最后再举几个撒谎的例子,脱口而出一个词的场景下:
大王:你和宰相在干什么?
我的真心话:我和宰相在准备夺你的权!
主谓宾撒谎:我和宰相……在商量什么时候去打猎!
谓主宾撒谎:准备夺……我和宰相……(夺啥好呢?)超级女生总冠军!——糟糕透了
宾谓主撒谎:你的权……得了,后面也甭瞎编了

脱口而出两个词的场景下:
女生:你想啥呢?
男生真实想法:我想娶你。
主谓宾撒谎:我想……看电视。
主宾谓撒谎:我取(娶)你……的工资该多好啊想!(太别扭了吧?严格来讲“我取你的工资”应该是,“我你的工资取”,整句话应该是“我一事在想,我你的工资取多好啊!”,或者“我想,我你的工资取多好啊!”。不过任何语言有的时候也会用一些非正规的语序来表达,也不算太奇怪,就像我们也会说“你饭吃了没”一样。所以也算不太直白,至少不会非常尴尬)
谓主宾撒谎:想我……看电视。(跟主谓宾差不多)
宾谓主撒谎:娶你……得了,谁肯定是我,动作肯定是想嘛,甭瞎编了。

可以看见,宾谓主在撒谎特性上面一定是最差的。因为最重要的信息,或者说,如果我不告诉你,你最难猜出来的部分,不是动作,就是目标,肯定不是主体。主体太容易通过上下文猜出来了。而动作和目标两者看来,很可能目标的信息更重要,从上面两个例子看,“谓主宾”结构在撒谎上面还不算太差,至少比宾语在前面的要好多了。我们回头看看,最主流的两种语序结构,都是主语在前面的。接下来是谓主宾,注意了,为什么不是谓宾主呢?看来宾语放在主语后面更常见,我看主要就是为了掩饰,为了撒谎。宾语放前面的语言,无论是宾谓主,还是宾主谓,都是极罕见的。没有为什么,我觉得肯定是很难撒谎!这两者又以宾谓主最少见,可见主语是最不重要的,最容易猜测的部分。

现在再拿“主谓宾”和“主宾谓”来比较一下。其实“主宾谓”结构,如果用计算机来分析,是很好分析的。遇到名词就压到堆栈里面,遇到动词,就弹出栈里面的名词。如果动词是及物动词,则至少弹出两个名词,根据上下文,如果有间接宾语则弹出三个,否则如果是不及物动词就弹出一个名词。将弹出来的名词和当前的动词结合,做一个分析,理解了之后把它变成“一件事情”这个替代名词压回堆栈。一直重复这个过程,就可以完成整句话的语法分析了。这对计算机很简单,对人来讲就麻烦了。你说说“阿猫阿狗老鼠公鸡揍看告诉”的句子是啥意思呢?很明显,人类的大脑是一个“解释型的机器”,而不是一个“栈式机”。与此类似的另外一个常见的东西,就是数学表达式,你会写成 3*(4-6*(2+5*(6-1)),而不会写成3462561-*+*-*。除了人脑无法处理很深层次的“压栈出栈”操作之外,还有一个原因是,主语和宾语很多时候是同等性质的东西(名词)。两个名词放在一起,有时候就会交错产生歧义。举个特殊点的例子:
刘燕飞机坐

你说是刘燕坐飞机呢,还是刘燕飞做机呢?(同音字念一下)说起来两者是十万八千里。难怪韩语还有用来表示是宾语或者主语的“字”或者说“发音”呢,就是为了避免搞错了。其实看数学表达式也是一样的,132+是指13+2还是1+32?所以最后不得不引入辅助结构。对于汉语这类一个音节可能代表多个含义,多个音节成一词的语言还好一点,基本可以用某一个音节来作为结构指示。比如说汉语里面就有很多“把”、“被”、“了”、“在”,古汉语也有“是”、“之”、“乎”、“也”等。但是对于英语这种拉丁语系,一个音节没有特定含义的,那么辅助结构就难免出现一些变形,比如说英语的动词过去式就会有不规则变化,复数形式也会有不规则变化。因为你如果只要听到es发音,就认为是复数,听到ed发音就认为是过去式,那么一些er结尾的词和s或者d开头的词就有可能产生发音的歧义。这个时候语言就会开始变得复杂了,需要记住很多不规则的地方。偏偏名词是占词汇量加大的一部分,而且随着人类认知的变化会逐渐增多。名词越来越多,要考虑的发音冲突就越来越多,避免冲突的难度也越来越大,不规则变化也会越来越多。这种额外的开销,也有可能会迫使人们去改造语言的结构。

主谓宾难道就没有缺点了吗?也有。通常当一句话内部有很多从句的时候,主谓宾分析起来就会比较困难,尤其是各个动词之间的层次关系问题。举一个例子:
中国人经常会互相问候你吃饭了吗其实是美国人传给英国人的是小王骗小李的(一口气念下来,所以去掉标点符号)
其实从上至下,组织结构是
A是B
A指的是:C是D;B指的是:小王骗小李
C指的是:中国人会互相问候一句话E;D指的是:美国人传给英国人的。
E指的是:你吃饭了吗?

这个解析过程够“唐僧”的,不过确实是,你要在这么大一段句子中众多的动词里面,挑出最顶层的动词,也不是一件容易的事。但是即便有这么一个缺点,解决起来确实很简单,只要有点停顿,外加极少指代名词就能够解决了:
中国人经常会互相问候你吃饭了吗,(这件事)其实是美国人传给英国人的,这是小王骗小李的。

在一整句比较好理解的子句上停顿,比在每一个名词上面加语法结构词(音),效率会高一些。那些加进去指代名词,也比每一个词后面的修饰要有效一些。

长篇大论了一些空想,各位看官不反胃我已经觉得是万幸了。
posted on 2007-07-20 21:07 Sumtec 阅读(443) 评论(8)  编辑 收藏 所属分类: 其他

评论

#1楼  2007-07-27 15:16 Ballack85      
支持,很幸运能够学习到您的技术和思想。
  回复  引用  查看    

#2楼  2007-07-27 15:44 sumtec@beijing      
hehe, 互相学习
  回复  引用  查看    

#3楼  2007-08-01 17:19 鹤 [未注册用户]
太有才了兄台你!
兄台你才太有了!
太有兄台你才了!
才太有了兄台你!
尤其是撒谎的这个例子,嘿嘿,有意思。
  回复  引用    

#4楼  2007-09-03 15:32 Epictrue [未注册用户]
嗯,这确实是个有趣的问题。。。

你讲的都没错,不过说主谓宾有利于说谎那也不是绝对的,我们也经常针对主语提问啊,比如老师问学生谁打破了窗户,要是用宾谓主来回答就可以说"the window broke..."这就有时间思考了,但是用主谓宾就不行啦。
主宾谓占所有语言中的45%不知道是怎么统计出来的,如果有包括那些只有语音没有文字的语言(比如很多方言 )我倒觉得不奇怪,这类语言的总数绝对超出具备文字的语言数,但是它们有明显的口语化特点,我们平时说口语都是追求尽量方便、快捷和简单,过分追求语法严谨反而会让人觉得不亲切,因此把谓,宾提前是很常见的。相对的,我们都知道OOP在开发大型工程时结构清晰有优势,但是在几千种计算机语言中不支持OOP的岂不是更多。
  回复  引用    

#5楼  2007-09-03 15:39 Epictrue [未注册用户]
名词数量远多于动词这个原因基本上是公认的。其实我觉得最本质的原因是谓语起到连接主宾的作用,理所当然要在中间,比如一扇门联结了两个房间,当然是房间1-门-房间2,而不是门-房间1-房间2,这是根据逻辑思维自然决定的。
人脑当然不是基于堆栈的,事实上如果是"我听说小李看见小王揍小赵",大脑在读取"我听说"时就已经对此分析编码,并且期待后面接上一件事作为宾语,但如果用"我 小李 小王 小赵 揍 看见 听说"这样的后缀表达式,大脑读到"我 小李 小王 小赵"了都不能理解,只能像电脑一样傻呼呼的压栈出栈,而人脑是不擅长保存这么长的栈的。所以在3*4-6*2+5*6-1和 -*+*-*3462561中,即使告诉你"所有数字都是个位数,运算符优先级相同且左结合"你也会选择后面那种非常Lisp的写法。

再者前后缀表达式都是基于函数的,如+ a b就是Add(a,b),但a+b可以看成a.Add(b),这可是面向对象的语法喔。以"我听说小李看见小王揍小赵"为例,假设Person类有Hear,See,Hit这几个方法,语法是public Event MethodName(ref Person p)或者public Event MethodName(Event e);主谓宾表达就是:我.Hear(小李.See(小王.Hit(小赵))),如果是后缀:(我 小李 小王 小赵 Hit See Hear),See的发起者小李和See的距离就很远,没法实现面向对象语法。

不知同意我这种观点吗
  回复  引用    

#6楼  2007-09-03 18:13 sumtec@beijing      
事实上中文也有近似“主宾谓”结构的语法的,所以你说的内容不太成立。例如:

我对“他把小俐揍了一顿”无法理解。
这就是近似的主宾谓嵌套,不见得你不能理解吧?
当然,如果太长了,理解起来就会有困难,但是仍然是可以被理解的。

对主语提问的时候,人的精神都会高度集中,尤其是需要撒谎的时候。
比如你说的问“谁打破了窗口?”,多数情况下你对会一下子打起精神,说“他”。而且即使犹豫了一会儿,提问者仍然是无法确定你是因为撒谎所以需要时间思考,还是真的想不起来了。

但是如果你问“你刚才是不是打破了窗口了?”,你要是稍微犹豫一下,人家就能够知道你正在准备撒谎(搜肠刮肚想你的不在场证据)。

类似的,“你刚才做什么了?”,也是无法犹豫的。所以对谓词和宾语做检测,是比较直接的检测撒谎的方法,你不可能不清楚刚才你在做什么。即使是问“他刚才做什么了?”,那么不知道就是不知道,知道就是知道。如果你要打算捏造答案,要想的事情都会比较多。貌似是这样的。

您太过于从计算机的思维去揣测人的思维了,也太过于从自己的语言习惯来揣测语言为什么是这样的。对你来讲,谓词是连接主语和宾语的桥梁。但是对于别人来说,也许恰好是宾语构成了主语和谓语的桥梁。(想想,我把他揍了一顿,说起来照样朗朗上口,理解起来毫不费力。)
  回复  引用  查看    

#7楼  2007-09-05 18:01 Epictrue [未注册用户]
因为是在cnblogs上,所以我才一直把自然语言往编程上扯的,呵呵

您也同意了"把"字句迭代多次以后"理解起来就会有困难,但是仍然是可以被理解的。"其实我也没说主宾谓不能理解,只是不易理解罢了。

“你刚才是不是打破了窗户了?”——这好像和语句的结构没什么关系吧,因为这是个一般疑问句(在英语中),只需要用是/否来回答,并没有针对哪个成分提问。

“你刚才做什么了?”——不好意思,我很健忘,刚才我开了机,联了网,开了浏览器。。。但我要犹豫很久才能回答你,可是这不表示我做了坏事,或者想隐瞒什么吧?
  回复  引用    

#8楼  2007-09-05 18:14 Epictrue [未注册用户]
我确实只是根据自己的语言习惯认为“谓语连接主宾”。现在我猜测是不是由于自然语言中的迭代次数不至于太多所以才有非主谓宾的语言,因为好像没有听说有用非中缀的方式来表达四则运算的,所以我还是觉得主谓宾比较自然。

不过话又该回来了,我完全没用过非主谓宾的语言,在这个问题上我没有发言权。如果有哪个韩国人觉得主谓宾好那才有说服力。


  回复  引用    


标题  
姓名  
主页
Email (只有博主才能看到) 
验证码 *  看不清,换一张 [登录][注册]
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
 

另存  打印