语言与智能的新见解

人类的符号活动不能建模吗?当前的大语言模型成功模拟了人类语言与智能吗?怎样才能更好地接近AGI?或者我们还能对语言与智能有进一步的理解吗?“A Study of Language and Intelligence through the Lens of Symbolic Medium”一书对这些问题给出不同的思考。因为作者反思内容的新颖,不同领域的众多概念都是在新的语境下诠释,理解也许不容易。本文对此书做个简单的介绍与讨论。
该书提出的一个核心观点是:如果符号媒介或者符号媒介系统不同,那么可利用的媒介物理属性与可发展出的媒介物理操作也将不一样,在此基础上可形成不同的符号使用方式,并带来不同的符号活动与效果。这一观点不仅可指导对符号活动的历史分析,也用于预测它们的未来,这主要是针对视觉符号而言。
论证上述观点涉及对符号媒介、符号媒介工具、符号媒介场以及符号媒介系统(一个统称)的定义。关键的是要知道符号的使用最终是对符号媒介的物理操作以形成可感知的符号表达。
该书提出历史上对符号的操作依次出现了三种方式,第一种是构造。人类婴儿学习说话,第一个阶段只是说出单个词。通过声音交流的多数动物,每次表达也是发出单个的音,重复二三次,配合调式上的变化。这些都是此操作的体现。
第二种操作方式是组合。与其它动物不同,人类口语每次可以产生多个音节的声音,且每次表达包含的音节及其顺序很少重复。人类的发音能力配合智力能够区分不同的音节并加以组合。通过对英文与中文的具体分析此书提出:各门自然语言的首要机制是形成一种符号线性组合的规则性。
第三种操作方式是代换。这是此书论证的一个重点,串联着各章节的内容。简单地说,代换操作就是连续进行了二次组合操作,第一次组合结果中包含一个成分A,第二次组合结果中A被代换为B,其它成分未变。因为人类记忆能力的限制,代换操作不会在口语里形成系统性的应用;在书面语言里,因为符号的持久性形成了一种外部记忆,代换操作才得以应用与不断发展。
这引向对符号属性的探讨。此书认为静态性是当前所用符号的最基本属性,对应着观念上的同一,是我们使用符号的心理基础。持久性则是静态性上的一个相对概念,显然书写符号比声音符号更持久。传统语言学所强调的属性,如离散性,则有着更多人为选择的成份。
其次,这也引向对符号媒介工具,媒介场,或者说媒介系统的探讨。符号表现出的属性最终是符号媒介系统对符号媒介物理性质的一种利用。在纸笔符号媒介系统,时间上顺序产生的符号流可转换为二维空间上的静态分布。这一转换有着怎么评价都不为过的意义,它是代换操作得以发展的基础,更多的符号可以稳定地非线性地聚合以表达复杂的观念或操作,以及其它更多的意义。
那么,代换操作带来了什么?理解这一问题首先要了解此书的研究方向:认知方向的符号活动。自然语言并不专用于认知方向,但其在认知上的作用无疑是交流能够有效进行的基础。逻辑、数学以及各门科学上的理论工作,也可从符号活动的角度看待。这样,符号活动的主题就跨越了传统上的不同学科。本书的论述主要是在比较自然语言与科学中(广义理解,包括逻辑、数学、自然科学与社会科学)中符号活动的不同进行的。
此书认为系统性应用代换操作当前科学上的符号活动的主要特征。对此的论证如下。各门科学的成熟理论都是应用逻辑与数学建立的。传统上整个数学可归结到算术与命题逻辑,它们的基础是运算律,计算表,重言式等。这些要素的表达式应用“=”,“⇒”、“⇔”等符号建立。这些符号除了用于静态地陈述一个命题外,实际也是过程中可进行代换操作的指示符。这一机制在书中称为等价-代换原理。虽然现代数学有了更多的进展,出现更基础的分支等,它们仍是同样操作上的构造与演绎。因为事情在此书所描述的层次并没有变化。
认知方向的符号活动最终是形成反映我们认知结果的符号及其表达的集合,典型地如公理系统。从可比较的角度,自然语言最初所反映的就是我们的常识。各门科学上的符号活动最终是想完整准确地反映周围世界以及我们自身。逻辑与数学反映了什么类型的认知,书中也有专门的讨论。知识以符号表达才可能验证、交流、传播与不断发展。
认知结果反映在符号及其表达上,意味着认知活动就是要在被认知对象与符号表达间建立某种映射。在这种认知过程中,我们的思想并不是天马行空,而是需要不断澄清事实,构造与应用符号进行匹配。重点是,符号的构造与运用受到既有符号操作方式影响,进而也影响着可建立的映射方式。
这引向了人类智能的课题。 此书的观点认为人类智能可分为连续的三个部分。第一是进化出的先天智力。此部分书中未展开讨论,只是提到我们天赋的局限,特别是感知范围与记忆能力。第二是在先天智力基础上形成的印象智能,以智能加工对象为印象或表象为特征,比如通常所说的形象思维。第三是符号智能,其特征是符号也成为智能的加工对象。如果不把表象也视为一种语言,那么,符号智能是语言出现前没有,之后不可逆转的人类特征。
人类常识从印象智能就开始积累,它非常局限,因为我们天赋是有限的。主要应用构造与组合操作的自然语言,只是提供一种静态描述。自然语言对常识的反映主要体现在日常词汇与常用语句上。更多时候,常识是潜在于我们的大脑,需要时才用自然语言表达出来,并且,这种表达进行了极大的简化。
自然语言的表达可以引发进一步的思维,这可以是回到印象层进行的思维。自然语言的这种作用,不仅使其可用于人际间的交流,也可以是与自己的对话。今天,当一个人思考时总会自言自语。自然语言的表达也是有意识思维的牵引。
此书认为逻辑、数学与各科学上符号活动是系统性地应用符号代换操作这一动态方法,对所研究对象及其关系与运动的模拟。对此的关键论证是:早期人类用小石子、小木棍进行计数计算,这只是用一类我们容易操作的离散事物对其它离散事物的模拟;算术则是对使用小石子,木棍进行计数与计算的符号模拟,这带来了代换-计算的方法。现代逻辑也是采用此方法将推理与证明的过程变成一种计算。这一方法通过逻辑与数学的应用扩散开来。各门类科学应用一组数学公式对各领域的规律建模,通过模型可带来的计算,其导出的表达能与领域的现象形成一致性的映射,这种映射最终是以测量来确认的。
现代科学的发展依赖于数学。数学自身从模拟外在对象及其关系与运动起源,后续发展更多得益于形式思维。这是一种在符号及其关系所形成的场景上进行的思维,可看作符号智能的一个明显体现。比如,为了实现计算可逆性或闭合性,去构造更多的数量类型与计算类型。正是通过这种更纯粹的符号思考,数学得以不断发展并具备普遍的形式。这可以让我们超越常识与自然语言表达的局限,取得今天这种强大的知识。
当符号活动实际成为人类智能的一部分时,需要认识到人类只凭借自身智力独立对符号进行操作的能力是有限度的,这突出表现于我们的心算能力。借助于纸笔的媒介系统,我们才可能进行完整的书写符号活动,对于计算类的符号操作,更有效的是创造各类计算工具来完成相应的操作。
历史上,最早的计数与计算方式是使用小石子或小木棍进行的。随着纸笔媒介系统的成熟,计算更多转向在纸面操作符号进行。然后,计算工具的发展又逐渐替代在纸面的计算操作。然而,计算机程序设计语言、各种程序的出现,又是要用符号描述出此类机器的能力与可能的操作。这可类比于当初用算术符号模拟小石子的计数计算。
此书从计算工具与纸面符号计算交互的角度来考察计算自动化的历史。考察可揭示现代理论计算机模型与计算基于代换操作这一观点相符的一面。并且这一考察还可引入出第二媒介的概念:计算工具上被操作的代表数值的物理对象。
计算工具出现的实际需要是进行更自动的计算。现代计算机主要是用于处理那些工程与技术上的数据。可以发现,微软的office一直以来也是一项主要的应用。在此书的框架下,计算工具可归在媒介工具的范畴。这类工具整体的目标应是统一支持人类完整的语言与言语活动。该书认为:在今天的技术条件下,计算机器向一种语言机器的演变是可预期的。
今天,随着大语言模型的出现,对符号的自动处理不限于计算的操作。此书对此也进行了讨论。首先,本书的内容提供了一个不同且广泛的背景来理解LLMs。其次,此书也对当前的大语言模型进行了分析评估。LLMs的能力主要体现在对已有知识的综合上,这可带来影响经济生活的应用。从实现AGI的角度,很难说LLMs具备了核心的功能。
虽然带有假想性,此书对语言机器进行了探讨,过程中也深化了前面章节的观点。总的思路是追求机器行为与人类符号行为的一致性去做技术实现。包括以代换操作的物理形式实现自动计算,以及这种能力如何体现在一种配套的语言上。以一种符号的连接机制实现符号活动结果的记载,这也可视为一种符号活动的建模。在此基础上可派生应用,它们是可替代人类特定符号活动的应用。探讨也涉及认识论上的议题,如在多大程度上人类的符号活动是对符号媒介的物理操作以及人类智力可以带来什么跳跃。本节的一个结论是语言机器的实现可提供一个基础,让人类智能与机器智能共同演变。
书中对语言机器探讨的这一节,是从支持现有书写符号的完整使用来考虑的。技术具有带来更多变化的潜力。首先,符号会是一种输入符号而非书写符号。利用机器在输入、显示、记录与通信等方面的特性,输入符号有可能不是离散的,甚至不再是静态的,符号生产与阅读也可能不再是线性的等等。
从历时语言学的角度,以更大的时间跨度来考察,本文的观点可表述为:语言的本质是通过技术的进步,推动符号媒介系统的改善或创新,带来符号使用上的进步。视觉符号的媒介系统是可选择的构建,没有什么符号使用方式是终极模式,我们的智能应用也同样。
本文只是一个简化了的介绍与讨论。

浙公网安备 33010602011771号