《控制论》读书笔记
《控制论》
诺伯特·维纳
64个笔记
非凡的阅读
- 知识分子阅读,不仅是指其特有的阅读姿态和思考方式,更重要的还包括读物的选择。在众多当代出版物中,哪些读物的知识价值最具引领性,许多人都很难确切判定。
- 我们相信,一切尖端的知识都能轻松理解,一切深奥的思想都可以真切领悟。
译者序
- 什么是控制论?这一命题长期以来众说纷纭,未有定论。幸运的是,维纳通过本书副题“关于在动物和机器中控制和通信的科学”,向人们揭开了它神秘的面纱,明确了控制论的深刻内涵和研究范围。具体说来,控制论就是在动物、人和机器等千差万别的复杂对象中归纳出一些普遍规律,以全学科联合的视角加以研究。
- 可以说,控制论的研究对象是从自然、社会、生物、人、工程、技术等不同对象中总结出来的复杂系统,它是一门包罗万象、举一千从的综合科学。而要理解这些不同系统之间的共同之处,控制论给出了一种接近数学方法,却比后者更加宽泛的通用方法。
- 我们知道,要研究这样一个无所不包的领域,普通的科学家想必难以胜任,他必定是位百科全书式的全才。若未广泛涉猎不同领域的知识,缺少锐意进取的创新精神,以及具有旁征博引、触类旁通的能力,是无法驾驭如此复杂主题的。基于此,维纳这位同时精通哲学、数学、科学和工程技术等众多领域知识的专家,不能不令我们肃然起敬。在一篇长达二万多字的序言中,作者交代了写作本书的缘由、创立控制论这一学科的必要性及其前景,介绍了控制论思想来自于四个方面:计算机设计、防空火控系统自动控制装置的理论、通信与信息理论,以及神经生理学理论。
- 从本质上说,控制论就是通信的理论,而输入、输出和反馈的概念则是控制论的基本概念。
- 第九章重点关注两个问题:人造机器是否能够自我学习和自我复制?答案是肯定的。
第二版序言
- 一门新学科要想真正地具有活力,就必须随着时间的推移而不断地更新它的关注点。
第一部分
- 这些专业领域不断发展,并不断侵入新的领域。结果就像美国拓荒者、英国人、墨西哥人和俄罗斯人同时入侵俄勒冈州时发生的情况一样——大家都来探索、命名和立法,纠缠不清。
- 正是学科的边缘地带,为有能力的研究人员提供了丰富的机会。同时,它们也是公认的最难用集体攻击和劳动分工对付的目标。如果某个生理问题的难点本质上是数学的,那么十个不懂数学的生理学家的成绩将和一个不懂数学的生理学家的一样,不会再多。如果一个不懂数学的生理学家和一个不懂生理学的数学家合作,那么其中一个人将无法用另一个人熟练使用的术语来陈述他的问题,而另一个人也无法以第一个人可以理解的任何形式给出答案。
- 我们一旦清楚地认识到,最优预测问题的解决只能通过待预测的时间序列的统计数据来获得,就不难将预测理论中原本看似难以解决的问题转化为实际用于解决预测问题的有效工具。
- 1946年夏天,我在洛克菲勒基金会的支持下,应墨西哥国立心脏病研究所的热情邀约回到墨西哥,继续我和罗森布鲁斯博士的合作。这一次,我们决定直接从反馈的主题中解决关于神经的问题,通过实验的方式验证我们到底能做些什么。我们选择猫作为实验动物,股四头肌作为用来研究的对象。我们切断肌肉的附着点,将其固定在已知张力的杠杆上,并记录其等长收缩或等张收缩数据。我们还用示波器记录肌肉本身同时发生的电位变化。我们主要对猫进行研究,首先在乙醚麻醉下去除大脑,然后通过脊髓的胸部横断切除脊髓。在许多情况下,还使用马钱子碱来增加反射反应。这时的肌肉负荷达到了这样的程度:轻拍就会使肌肉进入周期性收缩模式,用生理学家的话说就是阵挛。我们观察了这种收缩模式,注意猫的生理状况、肌肉负载、振荡频率、振荡的基本水平及其振幅。我们试图分析这些因素,就像分析显示相同狩猎模式的机械或电气系统一样。例如,我们采用麦克科尔的著作里关于伺服系统的方法。在此我不准备讨论我们研究结果的全部意义,我们现在正在重复这些实验,并准备撰写论文发表。然而,以下说法即使未被公认的,也是非常可能的:阵挛振荡的频率对负载条件的变化远没有我们预期的那么敏感,而且它更接近于由闭合弧——(传出神经)→肌肉→(动觉端体)→(传入神经)→(中枢突触)→(传出神经)——的常数决定,而不由其他任何因素决定。如果我们以传出神经每秒传输的脉冲数作为线性基础,则该电路甚至不是近似的线性算符的电路,但如果我们用其对数替换脉冲数,则似乎变得更加接近。这与这样一个事实相对应,即传出神经刺激的包络形式不是近似正弦曲线,而是该曲线的对数更接近正弦曲线;而在能量水平恒定的线性振荡系统中,刺激曲线的形式除了一组零概率的情况外,必须是正弦曲线。同样,促进和抑制的概念在本质上更接近于乘法而不是加法。例如,一个完全抑制表示乘以零,部分抑制表示乘以少量的倍数。在反射弧的讨论中使用的正是这些抑制和促进的概念[插图]。此外,突触是一个重合记录仪,只有在一个很小的求和时间内传入的脉冲数超过某个阈值时,传出纤维才会被激发。如果这个阈值与传入突触的全部数量相比足够低,则突触机制可以使概率成倍增加,甚至它只有在对数系统中才可能实现近似线性的链接。突触机制的这种近似对数性,显然与关于感觉强度的韦伯-费希纳定律[插图]的近似对数性一致,尽管该定律只是一个初步近似值。最引人注目的一点是,在这个对数基础上,根据单次脉冲通过神经肌肉反射弧的各个元件传导获得的数据,我们就能够利用伺服工程师开发的用于确定发生故障的反馈系统的振荡频率的技术,获得非常接近阵挛振动实际周期的数据。我们获得了大约每秒13.9次的理论振荡值,此时观察到的振荡频率在7和30之间变化,但通常保持在12和17之间的某个范围内。在这种情况下,这种一致性非常好。
- 现在来谈谈我认为值得关注的另一点。我很早就清楚,现代超高速计算机原则上是一种用于自动控制装置的理想的中枢神经系统;它的输入和输出不一定是数字或图表的形式,而很可能分别是诸如光电池或温度计等人工感觉器官的读数,以及电动机或螺线管的性能。借助应变仪或类似机构来读取这些运动器官的性能指数,并作为人工动觉向中央控制系统进行报告和“反馈”,我们已经有能力构建性能精细程度各异的人工机器。早在长崎事件和公众意识到原子弹之前,我就已经想到,当前面临着另一种社会潜能,它的重要性前所未闻,无论是善还是恶。不需要人类参与的自动化工厂和装配线之所以如此领先于我们,是因为我们对相关设计投入了巨大精力,正如在第二次世界大战中我们在发展雷达技术上付出的努力一样[插图]。
- 我说过,这种新的发展带来了无限善与恶的可能。首先,正如塞缪尔·巴特勒[插图]所构想的那样,这使得机器隐喻性的主导地位成为一个最直接且非隐喻的问题。它为人类提供了一批新型高效的机械奴隶来从事劳动。这种机械劳动具有奴隶劳动的大部分经济属性,与奴隶劳动不同的是,它不涉及人类残忍行为造成的直接影响。然而,任何劳动,只要接受与奴隶劳动竞争的条件,就表示接受奴隶劳动的条件,本质上就是奴隶劳动。这个说法的关键词在于竞争。对人类来说,机器使人类不再需要完成那些繁重和令人不快的工作,这很可能是好事,但也有可能不是。我不知道答案。但是我们不能用市场反应和它们所节省的资金来断定这些新的可能性是好的;恰恰是开放市场这种说法,即“第五自由”,成为了以美国制造商协会和《周六晚间邮报》为代表的美国舆论界的陈词滥调。我之所以说美国舆论,是因为作为一个美国人,我最清楚这一点,但商人是不分国界的。
第一章 牛顿时间和柏格森时间
- 这的确是一门理想的简单学科。在任何一门称得上是动力学[插图]的理论出现之前,甚至早在巴比伦时代,人们就已经意识到日食的发生遵循一定的周期规律,是可以预测的,无论是向后回溯还是向前推演,均能应验。人们认识到,用恒星在其轨道上周而复始的运动来衡量时间本身,可比任何其他方法都要好。太阳系中一切事件的运行模式均可用一个轮子或一系列轮子的转动来表示,无论是托勒密的本轮理论还是哥白尼的轨道理论,都是如此。而且,在任何一种这样的理论中,未来总是以某种方式重复着过去。天体音乐就是一首回文诗,天文历书倒着读和顺着读一样。除了初始位置和方向之外,顺时针转和逆时针转的两个太阳仪之间的运动,没有任何区别。最后,当所有这一切被牛顿归结为一组抽象的公设并推演出一门逻辑自洽的力学时,这种力学的基本定律不会因时间变量t变换为负值而改变。
- 如果说17世纪和18世纪是钟表时代,那么18世纪后期和19世纪则是蒸汽机时代,现在就是通信和控制的时代。在电气工程中存在一种分裂现象,在德国被称为强电流技术和弱电流技术之间的分裂,我们知道这就是电力工程和通信工程之间的区别。正是这种分裂,将过去的时代与我们现在生活的时代区分开来。诚然,通信工程可以处理任何大小的电流,机器动作的力量也足以驱动大型炮塔的引擎;它与电力工程的区别在于,它的主要目的不在于能源经济,而是要让信号准确再现。
第三章 时间序列、信息和通信
- 1914年,维纳的导师罗素要赴哈佛大学讲学半年,因此他建议维纳到德国格丁根大学进修几个月。在格丁根大学,维纳选修了希尔伯特讲授的微分方程、胡塞尔讲授的康德哲学课,还旁听了物理学家兰道讲授的群论。希尔伯特主要研究希尔伯特空间、几何基础、不变式理论、积分方程、代数数域理论等,从他身上,维纳不仅学到了必要的数学工具和技巧,更领略到了博大精深的数学思想。
- 上述场合下的信息传输速率的结果正是作者和香农已经得到的。可以看出,它不仅取决于可用于传输信息的频带[插图]宽度,还取决于噪声级。事实上,它与用于测量特定个体的听力和听力损失的听力图密切相关。这里横坐标为频率,下边界纵坐标为可听强度阈值强度的对数——我们可以称之为接收系统内部噪声强度的对数,上边界为系统适合处理的最大消息强度的对数。它们之间的面积,即式(3.922)维的一个量,则用作对耳朵能够承受的信息传输速率的测度。关于和布朗运动有线性关系的消息理论还有许多重要的变形。关键公式式(3.88)、式(3.914)以及式(3.922)都是重要的公式,当然,解释这些公式所需的定义也很重要。这个理论目前有如下变形:首先,在消息和噪声代表线性谐振器对布朗运动做出响应的情况下,由这个理论可以作出预测器和滤波器的最优设计;但是在多数情况下,只能作出预测器和过滤器的一种可能设计。虽然这不是绝对最好的设计,但它会最小化预测和滤波的均方误差,因为这可以通过执行线性运算的设备来完成。然而,通常会有一些非线性设备,其性能仍然优于任何线性设备。接下来,这里说的时间序列是简单的时间序列,其中单个数值变量取决于时间。还有多个时间序列,其中许多此类变量取决于时间;这些时间序列在经济学、气象学等领域最为重要。一天一天拍摄的完整美国天气图就构成了这样一个时间序列。在这种情况下,我们必须根据频率同时开发多个函数,并且诸如方程式(3.35)和方程式(3.70)的[插图]次量都被成对的量的阵列(即矩阵[插图])所代替。根据[插图]确定k(ω)的问题,以满足复平面中的某些辅助条件,将变得更加困难,特别是因为矩阵的乘法不是可置换的运算。然而,这个多维理论所涉及的问题已经被克林[插图]和作者解决了,至少是部分解决了。多维理论代表了一个已经给出的理论的复杂化。还有一种密切相关的理论是对它的简化。这是关于离散时间序列[插图]的预测、过滤和信息量的理论。这样的序列是一个参数α的函数fn(α)的序列,其中n为从-∞到∞遍历的所有整数值。量α和以前一样是分布的参数,可以让它均匀遍历(0,1)。当n到n+v(v为整数)的变化等价于α所遍历的区间(0,1)到自身的保测变换(一种特殊的可测变换,它除了保持集合的可测性外,还保持集合的测度不变)时,时间序列可以说是处于统计平衡状态。离散时间序列理论在很多方面都比连续序列理论简单。例如,让它们取决于一系列独立的选择要容易得多。每一项(在混合情况下)都可以表示为先前项与独立于所有先前项的量的组合,均匀分布在(0,1),并且这些独立因子的序列可以用来代替布朗运动,而布朗运动在连续情况下非常重要。如果fn(α)是统计平衡下的时间序列,并且具有测度可传递性,则其自相关系数为
- 众所周知,这种共振现象经常出现在生命物质中。圣捷尔吉曾指出了它在肌肉结构中的重要性。具有高共振的物质,通常具有储存能量和信息的超常能力,而这种储存肯定会发生在肌肉收缩中。
第四章 反馈和振荡
- 请注意,在这个系统中,在信息的传递和返回链(也就是从现在起我们所谓的反馈链)中有一个人工环节。确实,信号员并非完全行动自由;他给出的开关和信号以机械或电磁方式经过联锁处理;而且他不能自由地选择那些更糟糕的组合。然而,仍然有不存在人为因素干预的反馈链。我们用来调节房屋供暖的普通温控器就是其中一个例子。首先设定所需室温;如果房屋的实际温度低于设定温度,就会启动一个装置,该装置会打开风门,或增加燃油的流量,使房屋的温度升高到所需的水平。另一方面,如果房屋的温度高于所需的水平,该装置就会关闭风门,或减缓或中断燃油的流量。这样,房屋的温度就会大致保持在稳定的水平。需要注意的是,这一温度水平的稳定性取决于温控器的良好设计,而设计不当的温控器则可能会使房屋的温度剧烈振荡,就像患有小脑震颤的患者在运动时的状态一样。
- 反馈到控制中心的信息往往有反抗受控量偏离控制量的纠偏倾向,但该信息可能以截然不同的方式依赖于这种偏离。最简单的控制系统是线性的:效应器的输出是输入的线性表示,当我们增加输入变量时,我们也增加了输出变量。输出的读数由某种线性装置读取。这个读数可以直接从输入中减去。我们希望从理论上给出这种装置性能的描述,特别是关于当它操作不当或因过载而陷入振荡的情况给出一个精确理论。
- 我们已经看到,一般来说,像这样的复杂加性系统,无法通过某个单一反馈来稳定。
- 线性振荡和非线性振荡之间另一个非常明显的区别是:前者振荡的振幅完全与频率无关;后者通常只有一个振幅,或最多一个离散振幅集,这时系统将在给定频率下振荡,以及系统将产生振荡的离散频率集。这一点可以通过对管风琴管工作原理的研究而得到充分说明。有两种关于管风琴的理论:一种是相对粗略的线性理论,一种是相对精确的非线性理论。第一种理论将管风琴管看作一种保守系统。我们不关心风琴管如何得以振荡,并且振幅也完全不确定。第二种理论将管风琴管的振荡看作耗散能量,而这种能量被认为起源于穿过管口的气流。理论上确实存在穿过管风琴管口的稳态气流,该气流不与管风琴管的任何振荡进行任何能量交换,但是对于气流的某些速度而言,这种稳态条件是不稳定的。此时,最轻微的偏离就会将能量输入引入管风琴管的线性振荡的一种或多种固有模式中;这种能量大到一定程度后,这种气流运动实际上就会增加管风琴管的适当振荡模式与输入能量的耦合。通过热耗散[插图]和其他方式进行的能量输入,其速度与能量输出的速度具有不同的增长规律,但为了达到振荡的稳定状态,这两个量必须相同。因此,非线性振荡的程度与其频率一样能准确地确定。
- 在一定程度上,本章讨论的控制反馈系统和前一章讨论的补偿系统均为竞争对手关系。它们两者都能将效应器的复杂输入输出关系转化为简单比例的形式。正如我们所看到的那样,反馈系统的作用远不止于此,其性能相对独立于所用效应器的特性和特性变化。因此,这两种控制方法的相对用途取决于效应器的特性的恒定性。我们可以自然地假设,有利的做法是将这两种方法结合起来。结合的方法有多种,其中最简单的方法如图4所示。
- 此时,将补偿器和效应器组合成一个更大的效应器。一方面这种变化通常会改变允许的最大反馈,而且不容易看出是如何将反馈提高到重要的程度。另一方面,对于相同的反馈水平,它肯定会提高系统的性能。例如,如果效应器具有基本滞后的特性,则补偿器应为预期器或预测器,针对其输入的统计集合而设计。我们的反馈,即所谓的预期反馈,往往会加快效应机制的动作。
- 这种通用型的反馈肯定存在于人类和动物的反射中。在打猎时,我们试图最小化的误差不是枪的位置和靶的实际位置之间的误差,而是枪的位置和靶的预期位置之间的误差。任何防空火控系统都会遇到同样的问题。对预期反馈的稳定性和有效性的条件需要进行更彻底的讨论。
- 在结冰的道路上驾驶汽车时,我们会看到另一个有趣的反馈形式。我们的整个驾驶行为依赖于对路面打滑程度的了解,也就是说,对汽车—道路系统性能特性的了解。如果我们等待靠系统的普通性能来发现这一点,在我们发现以前汽车就会不知不觉滑出很远了。因此,我们给方向盘发出一连串小而快的脉冲,它不足以使汽车陷入严重打滑状态,但是足以向动觉系统报告汽车是否有打滑的危险,然后我们就会相应地调整我们的转向方法。
- 我们可以称这种控制方法为信息反馈[插图]控制,而且不难用机械的形式进行图式[插图]化,很值得在实践中使用。我们有针对效应器的补偿器,而且这个补偿器具有可以从外部改变的特性。我们在传入消息上叠加一个微弱的高频输入,并从效应器的输出中去除一个相同高频的输出部分,通过适当的滤波器与其余的输出分离。我们探讨了高频输出与输入的幅相关系,以获得效应器的性能特征。在此基础上,我们对补偿器的特性进行了适当修改。系统的流程图如图6所示。
- 这种反馈的优点在于它可以调整补偿器,使每种类型的恒定负载都具有稳定性;而且,如果与原始输入的变化相比,负载特性的变化足够慢,而且如果负载条件的读数准确,那么系统就不会产生振荡的趋势。在许多情况下,负载的变化以这种方式长久存在。例如,炮塔的摩擦载荷取决于润滑脂的硬度,而这又取决于温度,但这种硬度在炮塔的数次摆动中不会发生明显变化。
第五章 计算机和神经系统
- 一个值得注意的事实是,人类和动物的神经系统已知能够进行计算系统的工作,包含最适合作为继电器的元素。这些元素就是所谓的神经元或神经细胞。虽然它们在电流的影响下表现出相当复杂的特性,但在它们正常的生理作用中几乎符合“全有全无律”[插图]的原则;也就是说,它们要么处于静止状态,要么在“放电”时经历一系列变化,几乎与刺激的性质和强度无关。首先是一个活动期,以一定的速度从神经元的一端传递到另一端,随后是一个不应期[插图],在此期间神经元要么不能被刺激,要么无论如何不能被任何正常的生理过程刺激。在这个有效的不应期结束时,神经仍然处于不活动状态,但可能会因受到刺激再次变得活跃。
- 因此,可以将神经看作一种继电器,它基本上有两种活动状态:激发和不应。撇开那些从自由末梢或感觉末梢器官接受信息的神经元不谈,每个神经元都是从称为突触的接触点接受其他神经元传入的消息。对于一个给定的传出神经元,这些突触在数量上从极少到上百个不等。它是各种突触上的传入脉冲的状态,与传出神经元本身的先前状态相结合,会决定它是否会触发。如果它既不激发也非不应,并且在某个非常短的融合时间间隔内“激发”的传入突触的数量超过某个阈值,那么神经元就将在某个已知的、相当恒定的突触延迟之后触发。这也许是对事实的过度简化:“阈值”可能不仅仅取决于突触的数量,而且取决于它们的“权重”以及它们相互之间相对所传入的神经元的几何关系。而且有可信的证据表明,神经系统中存在一种不同性质的突触,即所谓的“抑制性突触”,这些突触要么完全阻止传出神经元的触发,要么至少提高了传出神经元对普通突触刺激的阈值。然而非常清楚的是,与给定神经元有突触连接的各传入神经元上的某些特定组合的脉冲会导致其触发,而其他脉冲输入则不会导致其触发。这并不是说可能不存在其他非神经元的影响,也许一种体液性质的影响就能产生缓慢持久的变化,往往会改变足以触发的传入脉冲的模式。
- 神经系统的一个非常重要的功能是记忆,而且如前所述,计算机也同样需要这项功能,记忆是一种保存过去操作的结果以供将来使用的能力。一方面,我们将看到,记忆有多种使用方式,不可能有任何单一机制能够满足所有需求。首先是执行当前进程(例如乘法)所必需的存储器,一旦进程完成,中间结果就变得没有价值,因此应释放设备存储空间以供将来使用。这样的存储器能够快速记录、快速读取、快速擦除。另一方面,还有一种记忆,是机器或大脑文件的一部分,能永久记录,而且至少在机器的一次运行中,能为机器未来的所有行为奠定基础。
- 顺便指出,我们使用大脑和机器的方式有一个重要区别:机器进行的多次连续运行之间要么不存在联系,要么只有少量、有限的联系,而且这些运行之间的数据可以被清除;而作为一个自然过程的大脑运转,几乎从来没有完全清除过去的记录。因此,在正常情况下,计算机并不能完全模拟大脑,计算机只是对大脑某种相似的单次运行的模拟。稍后我们将看到,该表述在精神病理学和精神病学中具有深刻的意义。
- 我们已经谈到了计算机,因此也谈到了大脑,作为一种逻辑计算机。考虑这种机器对逻辑的影响,无论是自然的还是人工的,这绝不是微不足道的小事。这方面的主要工作由图灵执行。[插图]我们以前说过,机械推理器只不过是有引擎的莱布尼茨的微积分推理器;正如现代数理逻辑以这种微积分为起点,因此它当前的工程发展必然会对逻辑产生新的影响,这是不可避免的事。当今的科学是运算性的,也就是说,它认为每个说法本质上都与可能的实验或可观察的过程有关。根据这一点,对逻辑的研究必须简化为对逻辑计算机的研究,无论是神经的还是机械的,都有其不可消除的局限性和不完善之处。
- 有些读者可能会说,这会把逻辑学简化为心理学,而这两门科学存在显著、可证实的差异。许多心理状态和思维过程都不符合逻辑规则,从这个意义上说,确实如此。心理学包含许多与逻辑无关的东西,但是一个重要事实——任何对我们有一定意义的逻辑都不可能包含人类思维——也就是人类神经系统——无法理解的任何方面。当谈及所谓的逻辑思维的活动时,所有的逻辑都受到人类思维局限性的限制。
- 伯特兰·罗素对他的悖论的解决方法是在每个陈述上附加一个量,即所谓的型,用来根据它所涉及的对象的性质——从最简单的意义上说,这些对象是否为“事物”,“事物”的类,“事物”的类的类——来区分形式上似乎为同一个陈述的东西。我们用来解决悖论的方法也是在每个陈述上附加一个参数,这个参数就是它被断言的时间。在这两种情况下,我们都引入了可成为均匀化的参数,从而解决了仅仅由于其未被重视而产生的歧义。因此我们看到,机器的逻辑类似于人类的逻辑,而且,按照图灵的方法,我们可以用它来研究人类的逻辑。机器是否也具有更显著的人类特性——学习能力?为了证明这一点,让我们考虑两个密切相关的概念:观念关联的概念与条件反射的概念。
- 在英国经验主义[插图]哲学流派中,从洛克到休谟,都认为心灵的内容是由洛克称之为观念的某些实体组成的,后来的作者则称之由观念和印象两部分组成。简单的观念或印象应该存在于一个纯粹被动的头脑中,就像一块干净的黑板上写着的符号一样,不受它所包含的观念的影响。通过某种不值得称之为力量的内部活动,这些观念应该根据相似性[插图]、联系性[插图]和因果关系[插图]原则,将自身组合成集合。在这些原则中,最重要的可能是联系性:在时间或空间中经常同时出现的观念或印象被认为具有相互唤起的能力,因此其中任何一个的存在都会产生整个集合。
- 所有这些都隐含着动力学,但动力学的概念尚未从物理学渗透到生物学和心理学。18世纪的典型生物学家是林奈[插图],他既是博物学家又是分类学家,他所持的观点与当今的进化论者、生理学家、遗传学家和实验胚胎学家的观点完全相反。事实上,世界有这么多领域需探索,生物学家的心态几乎也是如此。同样,在心理学中,心理内容的看法支配着心理过程的看法。这很可能是学术界对物质强调的一种延续,在这个世界里,名词是实体化的,而动词几乎没有任何分量。尽管如此,从这些静态的观念到当今更具动态性的观点所经历的过程,正如巴甫洛夫[插图]的作品所展示的那样,是非常清楚的。巴甫洛夫在对动物研究方面的工作比对人的研究要多得多,而且他关注的是看得见的行为而不是内省的思维状态。他在狗身上发现,食物的存在会导致唾液和胃液的分泌增加。如果在有食物并且仅在有食物的情况下向狗展示某个视觉对象,然后在没有食物的情况下再给狗展示这个对象,这个对象本身就能够刺激狗唾液或胃液的分泌。洛克通过内省观察到的由于观念的连续而发生的观念结合,现在变成了类似的行为模式的结合。
- 然而,巴甫洛夫的观点和洛克的观点之间有一个重要的区别,那是因为洛克研究的是观念,而巴甫洛夫研究的是行为模式。巴甫洛夫观察到的反应往往会使一个过程成功地完成,或避免一场灾难。唾液分泌对于吞咽和消化很重要,而我们认为的痛苦刺激往往会保护动物免受身体伤害。因此,有一种我们可以称之为情感基调的东西进入了条件反射。我们不需要把它与我们自己的快乐和痛苦的感觉联系起来,也不需要抽象地把它与动物的优势联系起来。重要的是:情感基调是按照某种尺度排列的,从消极的“痛苦”到积极的“快乐”;在相当长的一段时间内或永久性地,情感基调的提高有利于神经系统中当时正在进行的所有过程,并赋予它们提高情感基调的辅助效果;相反,情感基调的降低往往会抑制当时正在进行的所有过程,并赋予它们降低情感基调的辅助能力。
- 当然,从生物学角度讲,较大的情感基调必须发生在对种族(如果不是对个体)延续有利的情况下,而较小的情感基调必须发生在对种族延续不利(如果不是灾难性)的情况下。任何不顺应这一规则的种族都将走上路易斯·卡罗尔[插图]的“黄油面包上的苍蝇”的道路,而且总是会灭亡。然而,即使是注定灭亡的种族,只要种族继续延续下去,也可能显示出一种有效的机制。换句话说,即使是最具自杀倾向的情感基调配置也会产生一种明确的行为模式。请注意,情感基调的机制本身就是一种反馈机制。我们甚至可以给出关于这种机制的图表,如图7所示。
- 人们已经认识到,条件反射是一种学习机制,而且这一观点已经应用于研究迷宫中小鼠的学习行为。这里所需的关键是,所使用的诱因或惩罚分别具有积极和消极的情感基调。有一点可以肯定:实验者通过经验而不是简单地通过先验的因素,来了解这种情感基调的本质。
第六章 格式塔与一般概念
- 洛克认为,联想是根据毗连原则、相似原则和因果原则这三个原则进行的。
- ;但是此时,我们仅列举了关于读者现在一定已经熟悉的事实的另一个示例,即生物机制往往比最适合人类技工的技术的机制具有小得多的空间尺度,尽管另一方面,电子技术[插图]的使用使人工机械在速度上就大大超过了生物机体。
- 视觉最显著的现象之一是我们识别轮廓图的能力。一张轮廓图,比如说一个人的脸,在颜色或在光影的聚集上,与脸本身几乎没有相似之处,但它可能是脸这一主题中最容易辨认的图。对此最合理的解释是,在视觉过程的某个地方,强调了轮廓,并将图像的其他一些方面的重要性降至最低。这些过程的开始是在眼睛本身。像所有感官一样,视网膜也受到调节的影响,也就是说,对刺激的持续维持会降低其接收和传输刺激的能力。对以恒定的颜色和照度记录大块图像内部的受体来说,这一点尤为明显,因为即使是视觉中不可避免的焦点和注视点的轻微波动,也不会改变接收到的图像的特征。
- 因此,以听觉替代视觉的可能性的标准至少在一定程度上是皮层水平上可识别的不同的视觉模式和可识别的不同的听觉模式的数量之间的比较。这是一种信息量的比较。由于感觉皮层的不同部分的组织有些相似,所以比较皮层的两个部分的面积,很可能不会存在巨大差异。视觉区域面积与听觉区域面积之比大约为100:1。一方面,如果所有的听觉皮层都为视觉服务,我们可以预料,接收到的信息量约为通过眼睛传入的信息量的1%。另一方面,我们用于视觉评估的常用标准,是在一定分辨率下获得对象图像的相对距离,因此1%的视觉意味着信息量约为正常信息量的1%。这是极差的视力水平,但绝不是失明,拥有这种视力的人不会认为自己是盲人。从另一个角度来看,情况甚至会更加有利。眼睛只需使用其1%的视力就可以替代听觉去检测能够感受到的所有细微差别,而且仍然可以保持95%左右的视力,这可以说是视觉基本上完整的状态。因此,感官假体的问题是一个非常有希望的研究领域。
第七章 控制论和精神病理学
- 在电话系统中,重要的限制因素是用户发现其无法接通电话的那一段的短暂时间。即使最苛刻的人,也会对99%的通话成功率感到满意;而90%的通话成功率也足以使业务顺利进行,如果是75%的通话成功率就有点令人恼火了,但还是能让业务马马虎虎继续下去;而如果50%的电话都以通话失败告终,用户就会开始拒绝使用电话业务。现在,这些只代表了总体情况。如果呼叫要经过n个不同的交换阶段,而且每个阶段的失败概率相互独立且相当,那么为了使总的成功概率相当于p,则每个阶段的成功概率必须为[插图]。因此,为了在五个阶段后获得75%的通话成功率,我们必须在每个阶段保持大约95%的通话成功率。为了获得90%的通话成功率,我们必须在每个阶段保持大约98%的通话成功率。即使为了获得50%的成功通话率,我们也必须在每个阶段保持87%的成功通话率。由此可以看出,当单次呼叫故障超过临界水平后,所涉及的阶段越多,服务质量变得非常糟糕的速度就越快。而且当未完全达到这个故障的临界水平时,服务质量就变得非常好。因此,一个涉及多个阶段并针对特定故障水平而设计的交换服务,直到通信到达临界点的边缘才会显示出明显的故障迹象;而当它完全崩溃时,我们会遇到灾难性的通信堵塞。
- 在所有动物中,人类所拥有的神经系统最发达,而且人类的行为可能取决于最长的有效运作的神经元链。因此,他很可能在接近超负荷边缘的情况下高效执行复杂的行为,而一旦超过这个边缘,他就会发生严重的崩溃。这种超负荷可能以这样几种方式发生:要么由于需承载的通信量过大,通过对信道进行物理移除以便承载通信,要么由于这种信道被不良的通信系统(如已经上升到病态的循环记忆)过度占用。在所有这些情况下,当没有给正常通信留出足够的分配空间时,我们就会——很突然地——面临一种近乎错乱的精神崩溃。
第二部分
- 将控制论思想再次延伸,讨论人造机器能否自我学习、自我增殖的问题。我们认为生命系统所独有的两种现象是:学习和自我繁殖的能力。这些性质虽然看起来不同,但却彼此密切相关。会学习的动物能够顺应历史环境转化自身存在,并且能够在其个体的一生中适应自身所处的环境。会复制的动物能够创造出与自身相似的其他动物,尽管后者与自身并不完全相似,但至少近似相似,从而使其物种不会随时间的推移而变化。如果这种变异本身是可遗传的,那么我们就拥有自然选择可以利用的原材料。如果遗传的不变性与行为方式有关,那么在各种行为模式的遗传中,我们会发现一些模式对种族的继续存在有利,而且会自我稳固,其他对这种继续存在不利的模式则会被消除。与个体的个体学习相比,上述结果是某种种族或系统学习。个体学习和系统学习都是动物能够适应其环境的模式。
- 朱利安·赫胥黎在其关于鸟类智力的论文[插图]中已经指出,鸟类的个体学习能力很弱。昆虫也是类似的情况。在这两种示例中,对个体来说,最迫切的要求是飞行,因此相应神经系统的发育具有优先性,个体学习也必须从属这一目标。尽管鸟类复杂的行为模式——飞行、求偶、照顾幼鸟和筑巢——能够在第一次就正确执行,而不需要母亲的悉心指导。
- 换句话说,蛇的动作模式仅限于单次快速攻击,每次攻击都按自己的节奏进行,而猫鼬的动作模式则涉及战斗的整个过程中相当可观的一段(如果不是很长的一部分的话)。在这种意义上,猫鼬的行为就像一台学习机,其攻击的真正致命性取决于一个高度组织化的神经系统。
- 熟练的斗牛士会表演大量炫技的引逗、闪躲动作,如将红布甩向公牛以激怒挑逗、各种闪躲和环体转圈,等等,这些动作旨在使公牛进入猛烈攻击的状态,而且持续到斗牛士将剑精确刺入公牛心脏的那一刻。
- 我谈论过的关于猫鼬和眼镜蛇之间,或者斗牛士和公牛之间的战斗,同样也适用于人与人之间的身体对抗。让我们谈一谈用短剑进行的决斗。它由一连串的佯攻、躲避和猛击动作组成,每个参与者都希望对手的剑走空,这样他就可以在不使自己暴露于双重攻击的情况下将剑刺中对方。同样,在网球冠军赛中,每一次击球仅仅是完美地发球或回球是不够的,好的策略是迫使对手在进行一系列的回球中逐渐处于劣势,直到对手无法安全地回击为止。
第十章 脑电波和自组织系统
- 必须承认的是,到目前为止,脑电图的近期发展还未能实现该领域早期工作者的美好希望。他们当时的数据是由印字机记录下来的。这些数据是非常复杂和不规则的曲线;而且虽然可以辨别出某些主要的频率,比如每秒大约10次振荡的α节律,但是这种印字机记录的形式并不适合进一步的数学处理。其结果是,脑电图与其说是一门科学,不如说是一门技术,它依赖于训练有素的观察者在丰富经验的基础上识别印字机记录的能力。对脑电图的解读有很强的主观性,这是一个非常根本的缺陷。20世纪20年代末到30年代初,我对连续过程的谐波分析产生了兴趣。虽然物理学家以前曾考虑过这类过程,但研究谐波分析的数学家几乎还局限于研究周期过程,或那些在某种意义上随时间变大、正向或负向而趋于零的过程。我的工作是最早尝试将连续过程的谐波分析建立在坚实的数学基础上。在这篇文章中,我发现最基本的概念是自相关,而泰勒(现在的杰弗里·泰勒爵士)已经在对湍流的研究[插图]中使用了这个概念。
附录 人有人的用处:控制论与社会
- 一 什么是控制论?多年来,我一直致力于解决通信工程方面的问题。这引发了对各种通信机器的设计和研究,其中一些机器显示了它们模拟人类行为的神奇能力,从而揭示了人类行为的可能本质。它们甚至表明,在许多情况下,人类行为相对缓慢且效率低下,所以用机器替代人类行为有着巨大的可能性。因此,我们迫切需要讨论这些机器对人类的影响,以及这场新的根本性的技术革命将会导致的后果。对于我们这些从事建设性研究和发明的人来说,夸大我们所取得的成就存在重大的道德风险。对普通公众来说,假设我们的科学家和工程师在陈述新的可能事实的时候,会不惜一切代价为这些可能的事实辩护,甚至鼓励这种行为,这同样存在重大的道德风险。因此,许多人会想当然地认为,当研究人员意识到机器时代带来的巨大的全新可能性,并将这些可能性用于通信和控制时,他们的态度是为了机器的利益、为了最大限度地减少生活中的人为因素,敦促这项新“技术”得以迅速开发。这绝不是我的目的。
- 为传递信息而构建的模式,或信息在个体之间的传递,并不是一种孤立的现象。电报就是通过正确使用点和破折号来传递信息的;在这里,这些点和破折号必须选自包含其他可能性的集合。如果我发送的是字母e,它之所以有意义,部分原因在于我没有发送字母o。如果我只能选择发送字母e,则信息只是存在或不存在的东西;而且它传递的信息更少。
- 三 定型与学习:沟通行为的两种模式按照我们的观点,特定类型的机器和部分生命体——尤其是高等生命体,都能基于过去的经验改变自身的行为模式,从而达到反熵的特定目的。
- 控制原则不仅适用于巴拿马船闸,也适用于国家、军队和个人。在美国独立战争中,由于英国方面的粗心大意,已经下达的命令未能指挥一支英国军队从加拿大出发到达萨拉托加与另一支来自纽约的英国军队会师。伯戈因的军队因此惨败,而事实上一个精心设计的双向通信计划就可以避免这种败局。可见,无论是政府、大学还是企业的行政官员,都应参与双向交流,而非仅仅从事自上而下的沟通。否则,上级官员们或许会发现,他们制定的政策和下属知晓的事实完全背道而驰。同样,对于演说家们而言,对着一言不发、面无表情的听众讲话无疑是最困难的任务了。在剧院里,鼓掌的目的是为了在演员的脑海中建立少许双向交流——这一点是其本质。
- 社会反馈这个问题具有极大的社会学和人类学意义。人类社会的沟通模式多种多样。有些社会,比如说爱斯基摩人的社会,似乎没有酋长,社会成员之间也似乎少有从属关系,因此社会存在的基础,仅仅是为了满足人们在艰苦气候和缺乏粮食供应的挑战下生存的共同愿望;有些社会有阶级划分,比如说印度,两个人之间的沟通方式,会受到他们的血统和地位的严格制约;有些社会由专制君主统治,在这些社会中,臣民和国王之间的关系优先于任意两个臣民之间的关系;还有些等级森严的封建社会是由奴隶主和奴隶组成的,他们会用非常特殊的技巧进行社交。
- 在我们美国,大多数人喜欢生活在一个相对轻松的社会中。在这个社会里,个人和阶层之间的沟通障碍并不算太大。我并不是说美国已经实现了这种理想的沟通模式。只有“白人至上”这一信条在美国大部分地区废除后,这种理想模式才有可能实现。然而,对许多视效率为最高理想的人来说,即便是这种充满限制、形式多端的民主,也过于混乱不堪。这些崇尚效率的人希望每个人从童年起,就踏上一个已经指定好的社会轨道,像旧时匍匐在地的农奴一样,履行自己天生应该承担的职责。在美国的社会图景中,存在这些倾向,但拒绝不确定的未来赠予的机会是可耻的。许多人过于迷恋这种永久分配职责的有序状态。因此,对他们而言,如果被迫公开承认这一点,他们定会窘迫不已。他们只能通过自己的行为表现自己明确的偏好。其中,以下行为十分突出:商人雇佣一群唯他马首是瞻的人,以便别人能够把他和他的雇员区分开来;或者一个大实验室的负责人给每位下属分配一个特定的研究课题,但不给他独立思考的权利,以免他可以超脱眼前的问题,窥探到整个研究工作。这些都证明他们所崇尚的民主并非他们真正想要的生活在其中的秩序。他们向往的预先分配每个人职能的有序状态,令人不禁想到莱布尼茨自动机的特点,它在通向一个不确定的未来时,不会提供不可逆的活动,而这正是蚂蚁真实生活的条件。
- 在蚁群中,每一只工蚁都履行着其应有的职责;其中可能还存在一个专门的士兵阶层;高度专业化的特定个体履行着国王和王后的职责。如果人类社会也采取这种部落模式,那么人们将会生活在法西斯国家了。在这里,处于理想状态下,每个人从出生起就接受训练,然后从事自己相应的职业:统治者永远是统治者,士兵永远是士兵,农民永远是农民,工人也注定永远是工人。
- 本文的论题之一就是指出——法西斯主义者之所以渴望以蚂蚁社会为模型建立一个人类国度,是因为他们对蚂蚁的本性和人类的本性存在严重误解。一方面,我想指出的是,昆虫的身体发育本身就决定了昆虫本身是一个不会学习的个体。它们的身体好似在一方模具中铸造,注定不会有较大程度的改变。此外,我还想表明,这些生理条件是如何使昆虫成为一种廉价的批量生产物的;它们的个体价值,并不高于一个用后即丢的馅饼盘。另一方面,我希望表明,人类个体之所以能够进行广泛的学习和研究(这可能占据了人类一半的生命),是因为学习能力是人类身体与生俱来的,而蚂蚁的身体构造注定了它们不具备这样的能力。人体的感觉器官生来具备多样性和高潜力——这的确是人类成为至高无上的物种的关键——因为多样性和高潜力属于人类有机体本质结构特有的特征。
- 尽管我们可以对我们优于蚂蚁的巨大优势视而不见,以人类为材料去构建一个蚂蚁式的法西斯帝国,但我坚信这种做法是人类本性的退化,而从经济上说,是对宏伟人性价值的铺张浪费。
- 我愿意接受香农的如下推测:这样一台机器所下的国际象棋可能在高级业余水平,甚至可能在大师级别。它的博弈方式可能很僵硬,很乏味,但比任何人类棋手都稳健。正如香农所指出的那样,我们可以在它的运作机制中投入足够多的概率,用一个给定的固定博弈玩法序列,来防止纯粹的系统性持续失败。这种概率或不确定性可能会被纳入到两步棋后的最终位置评估中。
- 机器会使用开局让棋法,并可能使用标准开局让棋法和终局法像人类棋手一样结束博弈。一台完善的机器会把它下过的每一场博弈都记录下来,并补充我们通过搜索过去的博弈来找到合适玩法的过程。简而言之,这是依靠机器的学习能力来找到合适玩法的过程。尽管我们已经知道,具备学习能力的机器是可以被制造出来的,但制造和运用这些机器的技术仍然很不完善。目前,基于学习原理构建国际象棋博弈机的时机尚不成熟,尽管它极有可能发生在不久的未来。
来自微信读书



浙公网安备 33010602011771号