《计算机与人脑》读书笔记



《计算机与人脑》
[美]约翰·冯·诺伊曼
34个笔记
点评
-
2025/12/16 认为好看
好
序言
- 在20年代和30年代,约翰的科学兴趣广泛,且主要集中在理论领域。他出版的书籍包括量子理论、数学逻辑、遍历理论、连续几何、运算符环问题,以及许多其他纯数学领域的研究。随后,30年代末,他开始对理论流体力学产生兴趣,尤其是用已知分析方法求解偏微分方程的解时所遇到的巨大困难尤为上心。
- 战后几年,约翰的工作分散到不同领域的科学研究上。他开始对气象学产生了兴趣,因为在这个领域中,数值计算似乎有助于开辟全新的视野;他还花一部分时间帮助解决核物理中不断深入的问题。他继续与原子能委员会的实验室保持密切合作,并于1952年成为原子能委员会的总顾问委员会成员。
第一部分 计算机
- 第一部分 计算机我从讨论计算机系统的基础原理和计算机的实践开始。现有的计算机大致可分为两大类:“模拟计算机”和“数字计算机”。这种分类是根据计算机在运算中表示数目的方式而划分的。
第一章 模拟方法
- 第一章 模拟方法在模拟计算机中,每个数都由一个适当的物理量来表示。该物理量的数值以预先设定的量度单位来表示,等于问题中的数。这个物理量可能是某个圆盘的旋转角度,也可能是某个电流的强度,或者是某个电压(相对的电压)的大小等。为了使计算机能够进行计算,即根据预定的计划对这些数进行运算,就必须使计算机的器官(元件),使其能够对这些表示数值进行数学上的基本运算。
- 其中,经典式的“微分分析机”便是一个例子,它通过某些圆盘的旋转角度来表示数值。其过程如下:它不使用加法(x+y)和减法(x-y),而是采用平均运算[插图],因为用一种现成的简单元件——差动齿轮(像汽车后轴上使用的齿轮),就能够执行这种运算。它不用乘法(xy),而是采用了另一种完全不同的方法:在微分分析机中,所有的数量都表示为时间的函数,而微分分析机利用一个名为“积分器”的元件,能够将两个量x(t)和y(t)形成(“斯蒂尔杰斯”)积分z(t)≡∫tx(t)dy(t)。这个体系包括三个要点。第一,上述的三种基本运算通过适当组合,可以产生四种常用的算术基本运算中的三种,即加、减和乘。第二,当这些基本运算与一定的“反馈”方法结合时,就能实现第四种运算——除法。这里我不详细讨论反馈的原理。这里只是指出,尽管反馈看似是一种求解数学上蕴涵关系的一种工具,但实际上,它还是一种非常巧妙的短路迭代和逐次逼近的线路。第三,“微分分析机”的一个真正得到支持的根据是:它的基本运算[插图]和积分在解决许多类型的问题时,比算术运算(如x+y, x-y, xy,[插图])更为高效。具体来说,任何计算机在解决复杂数学问题时,都需要先为该问题作出“程序”。这意味着复杂问题的求解过程需要用计算机的各个基本运算的组合来表示。严格来说,这个程序通常只是这些组合的近似(近似到我们预定的任何程度)。对于特定类别的问题,如果一组基本运算能够通过更简单或更少的组合解出问题,那么这组基本运算就更有效。所以,对于全微分方程的系统来说(微分分析机本来就是为解全微分方程而设计的),其所使用的基本运算比前面提到的算术基本运算更为高效。
第二章 数字方法
- 常用的基本运算数字计算机的运算常常以算术四则为基础。关于这些已广为人知的过程,还应该讲以下几点。第一,关于加法:与模拟计算机中要通过物理过程作为媒介来实现加法不同(见前述),数字计算机中的加法运算由严格的逻辑规则来控制——如何形成数字的和、何时产生进位,以及如何重复和组合这些操作等。当使用二进制系统时,数字和的逻辑特性更为明显(相较于十进制而言)。二进制加法表(0+0=00,0+1=1+0=01,1+1=10)可以这样表述:如果两个相加数字不同,其和数字为1;如果两个相加数字相同,其和数字为0;如果两个相加数字都是1,则进位数字为1;如果两个相加数字都是0,则进位为0。由于可能存在进位,实际上需要一个3项二进制加法表(0+0+0=00,0+0+1=0+1+0=1+0+0=01, 0+1+1=1+0+1=1+1+0=10,1+1+1=11)。这个加法表可以表述为:如果相加数字(包括进位数)中1的数目为奇数(即1个或3个),则和数字为1;如果1的数目不是奇数,则和数字为0。如果在相加数字(包括进位数)中1的数目占多数(2个或3个),则进位数为1;如果1的数目不是多数(而是1个),则进位数为0。第二,关于减法:减法的逻辑结构与加法非常相似,通过简单的手段——补数法,就可以将减法简化为加法。
第三章 逻辑控制
- 第三章 逻辑控制除能够进行基本运算之外,一台计算机还必须能够按照一定的序列,更确切地说是按照逻辑模式来进行运算,以便解决当前数学问题,这和我们进行笔算的实际目的相同。在传统的模拟计算机中,如典型的“微分分析机”,计算的序列是通过以下方式实现的:计算机内部需要预先配备足够数量的器官来支持计算所需的所有基本运算,包括“差动齿轮”和“积分器”,它们分别执行基本运算[插图]和∫tx(t)dy(t)(参见上文)。这些圆盘,即计算机的“输入”圆盘和“输出”圆盘需要通过一定的方式彼此连接起来(更确切地说,是它们的轴必须连接起来)。在早期模型中,这种连接是通过嵌齿齿轮实现的,而在后期模型中,则采用了电从动装置(如自动同步器)来完成,以便模拟所需计算过程。需要注意的是,这种连接方式可以根据需求而灵活配置,即根据需要解算的问题而定,使用者可以将需要解决的问题或意图贯彻在机器设计里面。在早期的机器中(如前文提到的嵌齿齿轮),这种“连接”是通过机械手段实现的,而在后来的机器中(如前文提到的电气连接),则通过插接的方式完成。
第六章 现代模拟计算机的特征
- 第六章 现代模拟计算机的特征在现有的最大型模拟计算机中,基本运算部件的数量在一百到两百个之间。当然,这些部件的性质,取决于所使用的模拟过程。在不久以前,这些部件通常是电气的,或至少是电气-机械的结构(机械级用于提高精度,如前所述)。如果具备了周密细致的逻辑控制(如前所述),系统还会增加一些典型的数字执行器官(像所有这种类型的控制系统一样),如电磁继电器或真空管(在这种情况下,真空管并不会以极高的速度运行)。这些元件的数量有时可达到几千个。在极端情况下,这种计算机的投资可能达到100万美元的规模。
第二部分 大脑
- 第八章 神经元功能的简述观察神经系统时,我们最先注意到的是,它的功能显而易见是数字型的。我们需要更详细地聊聊这一现象,以及它是基于什么结构和功能得出这一结论的。神经系统的基本组成部分是神经细胞,也被称为神经元。神经元的主要功能是产生和传播神经脉冲。这个脉冲是一个相当复杂的过程,它涉及多个方面,比如电的、化学的和机械的。不过,这个过程看起来相当独特且稳定,也就是说,无论在什么条件下,它都几乎是一样的。对于各种各样不同的刺激,神经元都会给出一个本质上可以再现的、单一的反应。让我更详细地探讨一下神经脉冲的某些方面,这些方面在当前情况下看起来尤为重要。
第九章 神经脉冲的本质
- 第九章 神经脉冲的本质神经细胞包含一个细胞体,这个细胞体能直接或间接地延伸出一个或多个分支。这些分支,被称为细胞的轴突。神经脉冲是一种连续变化,沿着每一根轴突以固定的速度进行传导。这个速度也可能是与神经细胞相关的一个功能。就像之前提到的,我们可以从多个角度来理解这个现象。它的一个显著特征是存在一种电扰动;事实上,人们经常这样描述它。这种电扰动通常具有大约50毫伏的电位,持续约1毫秒。在产生电扰动的同时,沿着轴突还会发生化学变化。也就是说,在脉冲电位经过的轴突区域,细胞内液的离子构成会发生变化,因此轴突壁(细胞膜)的电化学性质(如导电性、渗透性)也会发生变化。在轴突末端,化学性质的变化就更加明显;当脉冲到达时,那里会出现特殊的标志性物质。最后,可能还伴随着机械变化。实际上,细胞膜各种离子渗透性的变化很可能只能通过分子的重新排列来实现,包括这些构成成分的相对位置的机械变化。还应指出,所有这些变化都是可逆的。换句话说,当脉冲过去后,轴突周围及其所有组成部分都会恢复到它们原来的状态。由于所有这些效应都发生在分子水平上——细胞膜的厚度仅为数个十分之一微米(约10-5厘米),这与所涉及的大型有机分子的尺寸相当。因此,上述电的、化学的和机械的效应之间的区别并不像最初看上去那么明确。事实上,在分子水平上,这些变化之间并没有明显的界限:每一次化学变化都是由分子内力的变化所引起的,这种变化决定了分子相对位置的变化,也就是说是由机械变化诱导的。此外,每一个这样的分子内力的机械变化都会影响所涉及分子的电性质,从而引起电性质的变化和相对电位水平的变化。总之,在通常的(宏观)尺度上,电的、化学的和机械的过程是可以明确区分的。然而,在接近分子水平的神经细胞膜中,所有这些方面都趋于融合。因此,神经脉冲成为这样一种现象也就不足为奇了,我们可以从这几个方面中的任何一个方面进行观察。
- 由脉冲引起的刺激脉冲的机制,它的数字特性我现在可以重新谈谈这个机制的数字特性。神经脉冲可以明确地看作是两值符号,就像我们之前讨论过的那样:无脉冲时表示一个值(比如二进制数字中的0),有脉冲时则代表另一个值(如二进制数字中的1)。当然,这必须被理解为是在某个特定的轴突上(或者更确切地说,是在某个特定神经元的所有轴突上)发生的情况,并且可能与其他事件在时间上有着特定的关联。因此,我们可以将其视为一个具有特殊的、逻辑作用的符号(即二进制数字中的0或1)。如前所述,神经元轴突上出现的脉冲,通常是由撞击在神经元细胞体上的其他脉冲激发的。这种激发通常是有条件的,意味着只有特定组合和同步性的原始脉冲才能激发出我们所说的派生脉冲,而其他情况则不会产生这种激发作用。换句话说,神经元是一个能够接收并发送脉冲信号的器官。当神经元接收到具有特定组合和同步性的脉冲时,它会受到刺激并发出自己的脉冲;反之,它就不会自己发出脉冲。决定神经元对哪些脉冲组合作出反应的规律,就是支配这个作为作用单元的神经元的规律。这显然是在描述数字机器中一个器官的工作原理,以及对数字器官的作用和功能的描述。因此,这支持了我们最初的观点,即神经系统具有一种“最初看见的”数字特性。让我对“最初看见的”这个描述再多说几句。上面的讲述里,有些内容是理想化和简化的,这些我们后面会详细讨论的。如果考虑到这些因素,神经系统的数字特性可能就不那么直观和明确了。不过,前面强调的那些特点仍然是主要且显著的。因此,从强调神经系统的数字特性开始讨论,似乎是比较合理的。
- 神经反应、疲乏和恢复的时间特性在深入探讨之前,我们先来聊聊神经细胞的大小、功率消耗以及速度等。要是把这些特点和神经细胞的主要“人造对手”——也就是现代逻辑和计算机器中常见的器官,比如与真空管(还有最近出现的晶体管)做个对比,你会发现这些特点非常有意思。我之前说过,神经细胞的刺激通常发生在它的细胞体附近。但其实,沿着轴突也能产生一个完整的正常刺激。就是说,如果在轴突的某个点上施加适当强度的电位或化学刺激,那里就会产生一个扰动,且很快就会发展成标准的脉冲,从被刺激的点开始沿着轴突向上和向下传播。上面所讲的通常的刺激,往往发生在从细胞体伸展出来的一组分支附近,这些分支的尺寸虽然小,但本质上也是轴突,刺激会从这些分支传到神经细胞体(然后再传到正常的轴突)。这一组刺激接收器称为树状突起。有时候,正常的刺激来自其他脉冲(或多个脉冲),这些脉冲是从传递它们的轴突(或多个轴突)的一个特殊末端发射出来的,这个末端叫作突触。(一个脉冲,不管它是否只能通过突触引起刺激,或是它在沿着轴突传导时能直接刺激其他轴突,只有封闭的轴突除外。这个问题,在这里不需要讨论,但从现象上看,是有利于这样一个短路过程的假定。)刺激通过突触的时间大约是10-4秒的几倍。这个时间是从脉冲到达突触开始,一直到在被刺激的神经元的轴突最近点上产生刺激脉冲为止。但是,如果我们把神经元看作逻辑作用器官,那么上面这个定义并不是衡量神经元反应时间最有意义的方式。因为当刺激脉冲产生后,被刺激的神经元并不能立即恢复到原始的、被刺激前的状态,这就是所谓的“疲乏”。也就是说,它不能立即接受另一个脉冲的刺激并作出标准反应。从机器的经济角度来看,更重要的是衡量这样一个速度:当一个刺激引起标准反应后,需要多长时间,另一个刺激才能引起另一个标准反应。这个时间大约是1.5×10-2秒。从上面的数字可以看出,刺激通过突触的时间其实只占这个时间(10-2秒)的百分之一二左右,其余的时间都是恢复时间,也就是神经元从刺激后的疲乏状态恢复到刺激前的正常状态。值得注意的是,疲乏恢复是逐渐的。在更早一点的时间(大约在0.5×10-2秒时),神经元就能以非标准的方式作出反应,也就是说它也能产生一个标准的反应,不过新刺激要比在标准条件下所需要的刺激更强烈。这种情况具有更加广泛的意义,后面我们还会再提到的。因此,讲到神经元的反应时间时,这取决于我们如何定义它,大致范围在10-4到10-2秒之间,但更有意义的是后者。与此相比,现代真空管和晶体管在大型逻辑机中的反应时间在10-6和10-7秒左右(当然,这里我也考虑到了完全恢复时间,即器官恢复到受刺激前的状态所需的时间)。也就是说,在这方面,我们的人造元件远远超过了相应的天然元件,且速度要快104~105倍。关于尺寸大小的比较,情况就大不相同。衡量尺寸的方法有很多,最好逐一进行探讨。
- 神经元的大小,它与人造元件的比较不同神经细胞之间的线形尺寸各不相同。有些神经细胞紧密地聚集在一起,因此它们的轴突很短;而有些神经细胞则需要在身体较远的部位之间传递脉冲,因此它们的线形长度几乎可以与整个人的身高相比。为了得到一个明确且有意义的比较,我们可以将神经细胞的逻辑作用部分与真空管或晶体管的逻辑作用部分进行对比。对于神经细胞来说,逻辑作用部分是细胞膜,它的厚度大约是10-5厘米的几倍。而对于真空管,其逻辑作用部分是栅极到阴极的距离,这个距离是10-1厘米到10-2厘米的几倍。对晶体管来说,这就是“触须电极”(即非欧姆电极,包括“发射极”和“控制电极”)之间的距离,大约为这些部件直接作用环境的三分之一,这个距离大约略小于10-2厘米。因此,从线形尺寸的角度来看,天然元件是人造元件的[插图]左右。
- 能量的消耗与人造元件的比较最后,我们来比较一下能量消耗。一个作用的逻辑部件,从它的本质上讲,并不做任何功:刺激脉冲,比起它激发起来的脉冲来说,只要有几分之一的能量就足够了。而且,这些能量之间并没有内在的与固定的必然联系。这些能量几乎都散失了,也就是说它们转化成了热能而没有用来做相应的机械功。因此,我们所说的能量需用量,其实就是指这些能量的消耗量,我们也可以谈这些器官的能量消耗量。在人类的中枢神经系统(大脑)中,能量消耗大约在10瓦特数量级。考虑到大脑中大约有1010个神经元,这意味着每个神经元的能量消耗约为10-9瓦特。而一个真空管的典型能量消耗在5~10瓦特数量级上。一个晶体管的典型能量消耗约在10-1瓦特数量级上。由此可以看出,人造元件的能量消耗比天然元件要大108到109倍——这与我们之前提到的体积需求比例是相同的。
- 比较的总结综合以上所有比较,我们可以得出一个结论:在尺寸方面,天然元件比人造元件的相对比较系数是108~109,天然元件远较人造元件优越。这个系数是通过线性尺寸的比例乘立方求得,它们的体积比较以及能量消耗比较也是这个系数。然而,在速度方面,人造元件则比天然元件快104~105倍。
- 基于上述的数量评估,我们可以得出一些结论。不过,要记住,我们现在的讨论还只停留在表面,所以这些结论可能会随着讨论的深入而有所调整。尽管如此,现在提出这些结论还是有一定意义的。这三个结论如下。第一,在相同的时间内,如果作用器官总容量相等(总容量相等,是以体积或能量消耗相等来作定义),那么天然元件比人造元件所能完成的动作数量多104倍左右。这个倍数是由上面已求得的两个比例数相除而得出来的商数,即[插图]。第二,这些系数还表明,天然元件比自动机器优越,是由于天然元件倾向于构建拥有更多但速度较慢的器官,而人造元件则倾向于构建部件较少但速度更快的器官。因此,我们可以预期,一个组织高效的大型天然自动化系统(如人的神经系统)会倾向于同时获取并处理尽可能多的逻辑(或信息)单元。相反,一个组织高效的大型人造自动机(如大型现代计算机)则可以连续依次处理任务,即一个时间段内只处理一项任务,或者至少不会同时处理太多任务。也就是说,大型且高效的天然自动化系统以高度“并行”的线路为有利,而大型且高效的人造自动化系统则倾向于“串行”运作,并行程度较低。(可以参考之前关于并行与串行结构的讨论。)第三,需要注意的是,并行和串行运算并不是可以无限制地互相替代的。像我们在前面的第一点结论中,为了得到一个单一的“效率评分”,简单地将天然元件的尺寸上的优势系数除以速度劣势系数的方法并不总是适用。具体来说,并非所有的串行运算都可以直接转换为并行运算,因为有些运算必须在其他运算完成后才能进行,而不能同时进行(即它们需要使用后者的结果)。在这种情况下,从串行模式转换为并行模式是不可能的,或者即使可能,也需要同时改变程序的逻辑途径和过程的组织。相反,如果试图将并行转换为串行,也会对自动系统提出新的要求。具体来说,这通常会产生新的记忆需求,因为需要先存储前面运算的结果,才能进行后续的运算。因此,我们可以预期,天然自动机的逻辑途径和结构与人造自动机可能会有很大的不同。而且,人造自动机的存储需求可能会比天然自动机更加严格和复杂。在接下来的讨论中,我们还会再次提到这些观点。
第十章 刺激的判据
- 最简单的基本逻辑判据现在,我可以开始讨论之前提到的关于神经作用的描述中所包含的理想化和简单化的内容了。我之前已经指出,这些理想化和简单化是存在的,而且它们的影响并不微小,值得我们认真考虑。之前已经提到过,神经元正常运作时会发出标准的神经脉冲。这种脉冲可以由多种形式的刺激引发,如来自其他神经元的一个或多个脉冲。其他可能的刺激还包括外界的一些特定现象,如光、声、压力、温度等,这些现象能被特定的神经元感知。此外,它们还会使神经元所在的机体发生物理变化和化学变化。接下来,我们先从第一种刺激形式谈起,也就是来自其他神经元的脉冲刺激。我之前提到过一个特别的机制,那就是通过其他神经脉冲的适当组合来引起神经脉冲刺激。这个机制让我们可以把神经元比作典型的基本的数字作用器官。进一步说,如果一个神经元的突触与另外两个神经元的轴突相连,并且它至少需要两个同时到达的脉冲作为最低刺激阈值(也就是为了触发一个反应脉冲),那么这个神经元就像是一个“与”器官:它执行的是合取的逻辑运算(文字上就是“与”),因为只有当两个刺激同时作用时它才会作出反应。反过来,如果这个神经元的最低刺激要求仅仅是至少有一个脉冲到达,那么它就像一个“或”器官:它执行的是析取的逻辑运算(文字上就是“或”),因为只要两个刺激中有一个作用,它就会作出反应。“与”和“或”是逻辑运算的基础。加上“无”(也就是否定的逻辑运算),它们就构成了完整的逻辑运算体系。无论多么复杂的逻辑运算,都可以通过这三种运算的适当组合来实现。在这里我不会讨论神经元如何模拟“无”运算,或者我们如何完全避免使用这种运算。但上述内容已经足够说明我之前强调的观点:如此看来,神经元就像是基本的逻辑器官,因此它也是基本的数字器官。
- 接收器的刺激判据(在当前的特定背景下)除其他神经元输出的神经脉冲导致的刺激外,关于其他因素如何刺激神经元,这里只简单介绍几点。就像之前讨论过的,这些其他因素包括外部世界的现象(也就是发生在机体表面的现象),比如光、声、压力和温度等。某些特定的神经元对这些现象特别敏感,神经元所在的机体内会发生物理变化和化学变化。通常,我们把那些对其他神经元的输出脉冲作出反应的神经元称为“接收器”。然而,将所有在组织结构上能够对其他非神经脉冲刺激作出反应的神经元都称为“接收器”可能更为恰当,并把这两类神经元分别叫作“外接收器”和“内接收器”来加以区分。
第十一章 神经系统中的记忆问题
- 记忆各种可能的物理体现记忆的物理体现仍然是个未解之谜。许多学者对此提出了很多不同的看法。有人猜想,不同神经细胞的阈值(或者更简单地说是刺激判据)会随着时间变化,这种变化取决于神经细胞过去的历史经历。比如,如果一个神经细胞经常被使用,它的阈值可能会降低,也就是说它更容易被激活。如果这个猜想是真的,那么记忆就藏在神经细胞刺激判据的变化中。这确实有可能,但我在这里就不深入探讨了。一个更加惊人的想法是,假设神经细胞的连接(即传导轴突的分布)会随时间改变。这意味着以下情况可能会发生:如果一个轴突长时间不被使用,它以后可能就无法正常工作了;相反,如果一个轴突被频繁使用(比正常使用还要多),那么在这个特定的路径上,它形成的连接就会有一个更低的阈值(也就是说更容易被激活)。这样一来,神经系统的某些部分就会随着时间以及它们之前的历史经历而变化,它们自身就代表了记忆。另一种显而易见的记忆形式是细胞体的遗传部分:染色体以及构成它们的基因。这些显然是记忆的重要组成部分,它们的状态会影响,甚至在一定程度上决定整个系统的运作。所以,也可能存在一个遗传记忆系统。除了上述提到的,可能还有其他形式的记忆,其中一些也相当有道理。比如,在细胞体的一定面积上有某些特殊的化合物,它们是可以自我保持不变的,因此它们也可能是记忆的要素。如果我们认为存在遗传记忆系统的话,那么也应该考虑这种记忆形式。因为基因中的自我维持特性似乎也可以存在于基因之外,即在细胞的其他部分。在这里,我不会一一列举所有这些可能性,以及其他同样合理,甚至更合理的推测。我只想指出,即使我们还没有确定记忆具体存在于神经细胞哪一些特殊部分里,但已经有人提出了许多种关于记忆的物理体现,这些假设都有着不同程度的理由。
- 与人造计算机的类比最后,我想提一下,神经细胞系统能以各种可能的循环方式相互刺激,也能形成记忆。这种记忆是由作用要素(即神经细胞)构成的。在我们的计算机技术中,这类记忆经常被用到,而且具有非常重要的意义。事实上,它还是计算机上最早采用的一种记忆形式。在真空管型的计算机中,“触发器”(即一对能相互开关和控制的真空管)就是这种记忆的元件。在晶体管技术及几乎所有其他各种形式的高速电子技术中,都允许和要求使用像触发器这样的组件。它们就像早期真空管计算机中的触发器一样,也可以作为记忆要素使用。
- 记忆的基础元件不需要和基本作用器官的元件相同必须指出的是,神经系统不太可能使用基本作用器官作为其主要记忆载体。这类记忆,我们通常称之为“由基本作用器官组成的记忆”,它在各个方面都显得非常“昂贵”(即需要大量资源)。但现代计算机技术正是从这样的设置起步的——第一台大型真空管计算机ENIAC,它的主要记忆单元(即最快和最直接的记忆)就完全依赖于触发器。虽然ENIAC体积庞大(包含22000个真空管),但按今天的标准来看,它的主要记忆单元容量却非常小(仅包含几十个10位十进制数)。这个容量大约只相当于几百个位,肯定小于103位。在当今的计算机中,为了在计算机大小和记忆容量之间保持适当的平衡(参考上文),它通常大约有104个基本作用元素,而记忆容量则为105至106位。这是使用了与计算机基本作用器官在技术上完全不同的记忆方式。例如,真空管或晶体管计算机大都使用静电系统(如阴极射线管),或适当排列的大量铁磁芯等作为记忆存储。在这里,我不会尝试对这些记忆方式进行完整分类,因为还有其他重要的记忆方式,如声延迟式、铁电体式和磁致伸缩延迟式等(这里所列举的方式还可以继续扩展),它们不太容易归入上述分类。我只是想指出,记忆部分所使用的元件可能与基本作用器官的元件完全不同。这些关于神经系统的问题似乎对于我们理解其结构非常重要,但目前这些问题基本上还没有得到解答。我们已经了解了神经系统的基本作用部件,即神经细胞。我们有充分的理由相信,这个系统与一个容量巨大的记忆紧密相关。然而,我们目前还不清楚,这种记忆的基本组成单位,即其物理实体究竟是什么样子的。
第十二章 神经系统中的数字部分和模拟部分
- 第十二章 神经系统中的数字部分和模拟部分我们已经讨论了神经系统记忆方面相关的深刻、基础且广泛存在的问题。接下来,似乎应该探讨其他话题。然而,在神经系统中,关于那个尚未明确的记忆组件,还有一个较小的方面值得我们简单提及,那就是神经系统模拟部分与数字部分(或“混合”部分)之间的关系。接下来,我会对这部分内容做一个简短且不全面的额外讨论,之后我们再继续探讨与记忆无关的话题。我想阐述的观察结果是:神经系统可能会经历性质的改变,就像我之前提到的那样,它们可以从数字性质转变为模拟性质,然后又变回数字性质,这样的转变可能会反复多次。神经脉冲,也就是神经机制中的数字部分,可以控制某个过程的特定阶段,比如特定肌肉的收缩或特定化学物质的分泌。这个现象属于模拟类型,但它可能会引发神经脉冲序列,这是因为它能被适当的内接收器所感知。当这样的神经脉冲产生时,我们又回到了数字性质的过程中。如前所述,从数字性质到模拟性质,再回到数字性质的转变,可能会交替发生多次。因此,系统中的神经脉冲部分(数字性质)和涉及化学变化或肌肉收缩导致的机械位移(模拟性质)的部分,通过相互交替,可以使任何特定过程带上混合的性质。遗传机制在上述问题中的作用在上面所述的情况下,遗传现象起着典型的作用。基因本身显然是数字系统元件的一部分。然而,它们的作用在于刺激特定化学物质的形成,即特定酶的产生。这些酶是相关基因的特征,所以属于模拟领域。因此,在这个领域里,基因可以归入数字和模拟交互变化类型中的一个因素,这是我之前提到的更广泛类别中的一个例子。
第十三章 代码及其在机器功能控制中的作用
- 短码的功能根据图灵的设计方案,如果一个代码想让一台机器表现得像另一台特定的机器(即使前者模仿后者),那么这个代码必须做到以下几点。首先,它必须包含能被机器理解(有目的地执行)的指令(这些指令是代码的进一步的具体细节),这些指令能让机器检查所接收到的每一个命令,并判断这个指令是否适用于第二台机器的结构。然后,它还必须包含足够的指令(用第一台机器的指令系统来表示),以让机器执行动作,这些动作要与第二台机器在相应指令影响下执行的动作相同。上述图灵方案的一个重要成果是:通过这种方法,可以让第一台机器模仿任何一台机器的行为。这种使机器跟着另一台机器做的指令结构,可能与第一台机器原本特有的指令结构完全不同。也就是说,这个指令结构的复杂性实际上可能远超第一台机器原本的复杂性:第二台机器的每个指令,都可以包括第一台机器所完成的许多次运算。它可以包含复杂的、重复的过程,以及任何类型的多次操作。一般来说,只要涉及的是“基本”操作——也就是那些基础的、非复合的、原始的操作,那么第一台机器在任何时间长度内和在任何复杂程度的可能的指令系统控制下所能完成的任何操作,现在都可以实现。把这类派生代码称为“短码”,其实是出于历史原因。这些短代码最初是作为编码的辅助工具而开发的。简单来说,人们希望为机器编写的代码能比其自带的指令系统更简短,所以就想了个办法:把这台机器当成一台完全不同的机器,这台机器拥有更方便、更全面的指令系统,这样它就能够允许更简单、不那么冗长且更直接的编码了。
第十四章 神经系统的逻辑结构
- 数字方法的重要性这里要讨论一个相当重要的问题。任何为人类使用,特别是为了控制复杂过程而制造的人造自动化系统,通常都包含纯粹的逻辑部分和算术部分,也就是一个算术过程完全不起作用的部分和一个算术过程起着重要作用的部分。这是因为,按照我们思维和表达的习惯,如果不借助公式和数字,就很难准确描述任何真正复杂的情况。如果一个自动化系统需要控制像恒定的温度、恒定的压力或人体内的化学平衡等问题,那么当人类设计师要把这些任务列成公式时,他就会用数字的等式或不等式来描述这些任务。数字方法和逻辑的相互作用另一方面,要完成上述任务,又必须有和数字关系无关的方面,也就是说必须要有纯粹的逻辑方面。这就是一些定性原理,包括不依赖数字表达的生理反应或无反应。例如,我们只需要定性地描述:在哪些环境条件的组合下,会发生什么事件,而哪些条件的组合则是不需要的。预计需要高精度的理由这些说明告诉我们,如果把神经系统看作是一个自动系统,那它一定既有算术部分也有逻辑部分,而且算术部分和逻辑部分同样重要。这意味着,在研究神经系统时,从一定意义上来说,我们其实是在和计算机打交道,所以用计算机理论中常见的概念来讨论神经系统是很合适的。
- 这个问题之所以至关重要,原因在于:从计算机的使用经验中可以证明,如果一台计算机需要处理像神经系统那样复杂的算术任务,那么它必须由相当高精度的装置组成。因为计算过程可能很长,而在计算过程中不仅会累积误差,早期的计算误差还会在后续的计算中被放大。因此,所需的精度要远高于问题本身的物理性质所要求的。因此,我们可以推测:当把神经系统看作是一台计算机时,它一定有算术部分,并且这部分必须以很高的精度来运作。在我们熟悉的人造计算机中,考虑到这里涉及的复杂性,要求达到10位或12位的十进制数字的精度也并不过分。尽管这个结论听起来有些不合理,但正是因为如此,我们得出这个结论的过程才更值得探究。
第十五章 使用的记数系统的本质:非数字性,而是统计性
- 之前我们已经提到过,我们对神经系统如何传递数字材料有了一定的了解。这些信息通常是通过周期性或近似周期性的脉冲序列来传递的。当给接收器一个强烈的刺激时,它会在绝对失效限度过去之后,很快作出反应。而较弱的刺激也会让接收器以周期性或近似周期性的方式作出反应,但频率会稍低一些。这是因为接收器在再次作出反应之前,不仅需要等绝对失效限度过去,而且有时还需要一定的相对失效限度过去。因此,定量刺激的强度是通过周期性或近似周期性的脉冲序列来表示的,而脉冲的频率总是刺激强度的单调函数。这是一种信号的调频系统,它将信号强度表达为频率。在视觉神经的某些纤维以及传递压力信息的神经中,我们都直接观察到了这种现象。值得注意的是,这里的频率并不直接等于刺激的任何强度,而是刺激强度的单调函数。这意味着我们可以引进各种不同的标度效应,并且能很方便而恰当地用这些标度来作出精度的表达式。需要注意的是,上面所讲的频率通常在每秒50个至200个脉冲之间。显然,在这些条件下,上面提到的那种精确度(10位至12位十进制数字!)是完全不可能的。神经系统这台“计算机”却能在相当低的精确度水平上完成极其复杂的工作:根据上面的分析,它只能达到2位至3位十进制数字的精确度水平。这一点必须再三强调,因为目前我们还没有发现任何一台计算机能在如此低的精确度水平上可靠且有效地进行运算。还有另一点需要注意。上述系统不仅精确度较低,而且可靠性相当高。确实,在一个数字系统的记数中,如果缺失了一个脉冲,那么信息的意义就可能会完全扭曲,变得毫无意义。然而,在上述类型的系统中,即使丢失了一个脉冲,甚至几个脉冲(或者错误地、不必要地插入了一些脉冲),其相关的频率(即信息的意义)也只会发生微小的畸变而已,不会造成太大影响。
- 现在,我们面临一个必须认真回答的问题:神经系统作为计算机,从它的算术结构和逻辑结构相互矛盾的现象中,我们可以得出什么重要的推论呢?算术运算中的恶化现象,算术深度和逻辑深度的作用上面提出的这个问题,对于那些研究过长串计算过程中精度的恶化现象的人来说,答案显而易见。这种精度下降,就像之前提到的是由于误差的累积和叠加,尤其是早期计算中的误差在后续计算步骤中被放大了。这主要是因为需要进行大量的连续算术运算,换句话说,就是运算过程的“算术深度”很大。当然,许多运算需要按顺序逐一进行,这既是该程序算术结构的特点,也是其逻辑结构的特点。因此,我们可以说,所有这些精度恶化的现象,都是因为运算程序具有很大的“逻辑深度”而产生的。
- 算术精度或逻辑可靠度,它们的相互转换还需要注意的是,神经系统中所使用的信息系统,其本质上是统计性质的。换句话说,它不是规定的符号或数字的确切位置,而是信息出现的统计性质问题,即周期性或近似周期性脉冲序列的频率等。因此,神经系统似乎采用了一种与我们日常算术和数学中熟悉的记数系统截然不同的方式。它不是那种每个符号的记数位置、存在与否都对消息意义起着决定性作用的精确符号系统,而是一种通过信息的统计性质来传达消息意义的记数系统。我们已经了解到,这种方式虽然降低了算术准确度,但却提高了逻辑可靠性:算术上的不足换来了逻辑上的改进。信息系统中其他可利用的统计特性根据上面的内容,我们现在很自然地想再提出一个问题。之前我们提到,某些周期性或近似周期性脉冲序列的频率能够传递消息,亦即信息。这是消息的一个显著统计特性。那么,是否还有其他统计特性也能作为传递信息的工具呢?到目前为止,在传递信息时,我们使用的消息的唯一特性就是它的脉冲频率,也就是每秒钟的脉冲数。而这里所说的消息,是指一种周期性或近似周期性的脉冲序列。显然,消息的其他统计特性同样可以被运用。之前提到的频率只是单个脉冲序列的特性,但实际上,每个相关的神经都包含大量神经纤维,而每根神经纤维都能传输许多脉冲序列。因此,有理由推测,这些脉冲序列之间的某些统计关系也能传递信息。在这种情况下,我们自然会想到利用相关系数等诸如此类的办法。
第十六章 人脑的语言不是数学的语言
- 进一步探讨这个话题,我们不可避免地要涉及语言。之前已经指出,神经系统基于两种类型的通信:一种不涉及算术体系的,另一种则涉及,即指令的通信(逻辑的通信)和数字的通信(算术的通信)。前者可以理解为纯粹的语言叙述,后者则是数学的叙述。
- 我们应该认识到,语言很大程度上只是历史的偶然产物。人类的基本语言以多种形式传承给我们,而这些语言的多样性恰恰证明了它们并无绝对和必然之处。就像希腊语或梵语是历史事实而非绝对的逻辑必要一样,我们也只能合理地假定,逻辑和数学也很可能只是历史的、偶然的表达方式。它们可能存在本质上的不同形式,即除我们熟悉的形式外,它们还可能有其他形式。实际上,中枢神经系统的本质及其传递信息系统的本质都表明确实如此。我们现在已经积累了足够的证据,表明无论中枢神经系统使用何种语言,其逻辑和算术的复杂程度都低于我们日常习惯的水平。
- 一个明显的例子是,人类眼睛的视网膜会对眼睛感知到的视觉图像进行相当的重组。这种重组在视网膜上进行;或者更准确地说,在视觉神经入口处通过三个顺序相连的突触实现,即三个顺序相连的逻辑步骤。中枢神经系统在算术运算中使用的消息系统的统计特性及其低精度也表明,之前提到的精度下降在这些信息系统中并不会持续太久。
- 由此可知,这里的逻辑结构与我们通常在逻辑学和数学中使用的逻辑结构不同。如前所述,与我们在其他类似条件下所使用的结构相比,这些不同的逻辑结构在逻辑和算术深度上更低。因此,当我们把中枢神经系统中的逻辑学和算术方法视为“语言”时,它们在结构上必然与我们日常经验中的语言存在本质差异。还应该注意,这里提到的神经系统中的语言可能更像是我们之前提到的短码,而不是完全码。当我们谈论数学时,可能是在讨论一种建立在中枢神经系统真正使用的“第一语言”之上的“第二语言”。因此,从评估中枢神经系统真正使用什么样的数学语言或逻辑语言的角度来看,我们日常数学的外在形式并不总是完全适用。然而,前面关于可靠度、逻辑深度和数学深度的讨论证明,无论这个系统如何,它与我们有意识地、明确地认为的数学体系都存在着显著差异,这个观点是不会错的。
来自微信读书

浙公网安备 33010602011771号