物理学中的人工智能:历史、现状和未来
物理学中的人工智能:历史、现状和未来
——2024年诺贝尔物理学奖评析
摘要:2024年诺贝尔物理学奖颁发给John J. Hopfield和Geoffrey E. Hinton,以表彰他们在人工神经网络和机器学习领域的开创性贡献。这一决定引发了极大的争议。事实上,Hopfield和Hinton的研究深受物理学方法论影响,人工智能的发展也对物理学的研究方式产生了深远影响。人工智能的崛起不仅为物理学带来了新工具,也可能引发科学研究方法论的革命,推动科学范式的转变。这一奖项表明,人工智能已经成为推动物理学及其他学科发展的重要力量。
关键词:诺贝尔物理学奖;人工智能;科学范式
一、 2024年诺贝尔物理学奖的争议
(一)人工智能获得诺奖?
自1901年设立以来,诺贝尔奖已经发展成为全球最具声望和影响力的奖项之一。它涵盖物理学、化学、生理学或医学、文学、和平以及经济学等领域,旨在表彰那些“对人类作出卓越贡献”的个人或组织。
2024年,诺贝尔物理学奖授予了John J. Hopfield和Geoffrey E. Hinton,以表彰他们 “利用人工神经网络实现机器学习的奠基性发现和发明。”[①]这一决定引发了物理学界和公众的广泛讨论。许多物理学家质疑,将物理学奖授予主要从事计算机科学和人工智能研究的科学家,是否符合诺贝尔物理学奖的初衷。他们认为,Hopfield和Hinton的主要贡献在于计算机科学领域,而非传统的物理学研究。值得一提的是,Hinton早在2018年就因其在相关领域的杰出工作获得了计算机科学的最高奖项——图灵奖。
(二)物理学正在放缓
有评论指出[②],这一决定可能反映了物理学研究领域的困境,即传统物理学领域近年来缺乏重大突破,导致诺贝尔奖委员会将目光转向跨学科的研究成果。
诺贝尔的遗嘱中规定,诺贝尔物理学奖应授予“在物理学领域做出最重要的发现或发明的人”。然而,重要的成果往往可遇而不可求,这不可避免地导致不同年份获奖成果的质量参差不齐。如果超一流成果的产生频率低于诺贝尔奖的颁发频率,那么有些年份只能将奖项颁给一流成果,甚至有时连一流成果都难以找到,只得取消当年的颁奖。
目前,物理学似乎正面临这一困境。近年来,像阿秒物理学和引力波观测这样毫无争议的重大突破已经相继获奖,而那些长期“陪跑”的成果,如量子相位,则总因某些原因无法得到充分认可。同时,量子计算和凝聚态等新兴领域虽然前景广阔,但尚未成熟,颁奖给它们往往会引发争议。越来越多的人开始意识到,物理学的发展似乎在放缓。如今我们很难找到一个极具影响力且适合颁奖的成果了。
(三)人们的看法
伦敦帝国理工学院的天体物理学家Jonathan Pritchard在社交媒体上表达了他的困惑,认为尽管他对机器学习和人工神经网络持积极态度,但难以将其视为物理学的发现。他猜想诺贝尔奖受到了人工智能炒作热潮的影响。[③]
慕尼黑数学哲学中心的物理学家Sabine Hossenfelder也有类似的看法[④],她在发布的视频中声称两位获奖者的研究不属于传统物理学,或者一切都是物理学。并且强调诺贝尔物理学奖可以让人怀疑物理学遇到了危机。
有趣的是,当得知获得诺贝尔奖时,Hinton本人也感到非常震惊[⑤],甚至怀疑这是一个“诈骗电话”[⑥]。
另一方面,我们也能听到一些支持的声音。科普作家Anil Ananthaswamy认为物理学确实以非常强大的方式影响了机器学习,反之亦然,机器学习现在也在物理学的研究中发挥着重要作用。[⑦]
随着争议不断加剧,现在有必要对2024年的诺贝尔物理学奖进行一个全面的评析了。
二、 历史:人工智能诞生于物理
(一)Hopfield网络、反向传播与受限玻尔兹曼机
早在20世纪中叶,人工智能的概念已被首次提出。科学家尝试用数学模型描述大脑中神经元和突触的网络结构。受到神经科学中的赫布定律的启发,人工神经网络的最初形态——感知机被发明出来。然而当时的单层感知机能力十分有限,其实用性也受到了怀疑。
1982年,Hopfield从Ising模型中受到启发,提出了一种能够存储和重构信息的网络结构,称为Hopfield网络。Ising模型本是一个关于自旋系统的物理模型,用于研究物质相变的随机过程。Hopfield将网络的整体状态描述为物理系统中的能量。通过调整网络中的连接权重,使得存储的模式对应于能量最低的状态。当网络接收到不完整或被噪声干扰的输入时,它可以通过迭代更新节点状态,逐步降低整体能量,最终重构出最接近原始存储模式的输出。然而,Hopfield网络的效率仍然不高,且无法适应规模更大、要求更复杂的任务。
很快,Hinton在1986年发明了反向传播算法,使得训练多层神经网络成为可能。在Hopfield网络的基础上,Hinton又与同事发明了玻尔兹曼机(Boltzmann Machine)。他们利用统计物理学中的工具,构建了能够自主学习数据特征的网络。玻尔兹曼机通过输入大量样本,调整网络参数,使其能够识别数据中的特征元素,如图像中的特定对象。这一方法为后来的机器学习、深度学习和复杂模式识别奠定了基础。
虽然如今人工智能研究已被视为计算机科学的一个独立分支,似乎与物理学渐行渐远。但Hopfield和Hinton在人工智能上的早期工作,深受物理学方法论和思想的影响,与物理学有着密不可分的深厚渊源。这种联系并非偶然,而是从科学本质上自然而然的延伸。然而,对那些不了解这段历史的人来说,人工智能诞生于物理会相当令人意外。
(二)人工智能是应用物理成果
Hopfield说:“什么是物理?对我而言——在物理学家父母的环境下成长——物理并不仅仅是一门学科。原子、对流层、原子核、一块玻璃、洗衣机、我的自行车、留声机、磁铁——这些都只是物理的研究对象之一。物理的核心思想是,世界是可以被理解的,你应该能够把任何事物拆解开来,理解它各个组成部分之间的关系,进行实验,并基于此建立对其行为的定量理解。物理是一种看待世界的角度,即只要有足够的努力、创造力和资源,我们周围的世界是可以以预测性和相当定量的方式来理解的。成为一名物理学家,意味着对这种理解的追求的奉献与坚持。”[⑧]我们不难推断,从Hopfield的说法来看,这些工作是归属于物理学范畴的。进一步说,它应被视为应用物理的成果。
应用物理是针对实际用途而进行的物理研究。其成果通常体现为将理论物理的知识转化为能够用于改善人类生活、推动科技进步的实际应用。这些成果不仅包括技术创新、工具、设备或材料等可观测的突破,也涵盖了在解决实际问题中的重要进展。如果你带着应用物理的观点来审视人工智能,你会惊讶地发现人工智能完美契合了应用物理的定义。无论是基于材料物理发展的计算机硬件、前文提到的人工智能算法,还是伴随量子计算兴起而涌现的量子神经网络,这些技术无一不是建立在理论物理的基础上并转化为具体的应用成果。人工智能的每一个进步都离不开物理学的坚实支撑,并已经成为极为实用的工具,因此毋庸置疑,它也是应用物理的重要成果之一。
自1901年设立以来,诺贝尔奖始终关注科学研究对社会的实际影响,并嘉奖那些具有显著实用价值的发明,而不仅仅是纯理论的探索。甚至一些成果与计算机关系巨大:1956年的诺贝尔物理学奖授予晶体管的发明;2000年的诺贝尔物理学奖授予集成电路相关的发明。从这个方面来说,2024年物理学奖的颁发并非特例。人工智能作为应用物理最伟大的成果之一,其对社会产生的深远影响早已不言而喻,无疑进一步印证了这一奖项的合理性与必要性。
三、 现状:人工智能助力物理研究
时至今日,人工智能技术逐渐成熟,并在现代物理学的研究中发挥着越来越重要的作用。它可以帮助物理学家进行数据分析与挖掘、辅助构建物理模型等等。
(一)数据分析与挖掘
物理学实验往往会产生海量数据,尤其是在粒子物理学、天体物理学等领域。例如,欧洲核子研究中心(CERN)的大型强子对撞机(LHC)每天能产生140 TB的数据[⑨]。在这些庞大的数据中找到有价值的信号,是一个非常艰难的过程。人工智能,特别是基于深度学习的算法,可以在数据分析中有效过滤噪声,并提取出有意义的物理特征。
据相关报告显示,机器学习方法在LHC最重要的成果之一——希格斯玻色子的数据挖掘中起到了关键作用。[⑩][11]使用堆叠机器学习分类器(SMLC)和梯度提升树(GBT)等技术,可以在极短的时间内处理大量实验数据,并且找到此前可能被忽视的潜在信号。
C. J. Shallue和A. Vanderburg介绍了一种使用深度学习对开普勒太空望远镜的海量数据进行分类,以识别系外行星候选者的方法。[12]他们的模型是一种卷积神经网络,经过训练可以区分实际的凌日系外行星和食双星或仪器噪声等误报。该模型成功验证了两颗新的系外行星:一颗位于开普勒-80周围的共振链中,另一颗围绕开普勒-90运行,这使得开普勒-90与太阳并列为拥有最多已知行星的行星。
(二)物理模型的构建
物理学家通常需要构建复杂的数学模型来描述自然现象,而某些现象的复杂性使得这些模型的求解变得十分困难。人工智能可以辅助建立数据驱动模型,从海量实验数据中自动归纳出模型,相比于手动建立物理模型大大降低了复杂度。
在统计物理中,通过从微观规则进行逐步“重正化”,可以得到系统的宏观行为。而深度神经网络正可以被用来学习新的重正化方案。Koch-Janusz & Ringel[13]以及 Li & Wang[14] 首次尝试了这一方向。他们的结果表明,机器学习可以提取抽象的物理概念,从而成为理论和模型构建的一个组成部分。类似的例子数不胜数,例如Pathak 等人[15][16]使用循环神经网络来预测混沌动力系统的轨迹以及用于天气预报的模型。
另一个典型例子是,机器学习助力弦理论的研究。根据弦理论预测,可能存在数量级高达 种不同的时空,每一个都具有自己的物理学定律,形成了巨大的弦景观(String Landscape)。在对弦景观的研究中,机器学习不仅可以用于深度数据挖掘,验证了一个已知的猜想,还提出了一个新的猜想,随后也得到了证明。[17]因此,人工智能既有助于发现新的规律,也能够严格验证这些规律,从而推动物理学研究中的猜想生成与验证。
再如,在等离子体物理学中,模拟等离子体运动的方程非常复杂,且数值求解耗时巨大。近年来,DeepMind与国际热核聚变实验堆(ITER)合作,通过深度强化学习方法建立了一种新的用于控制等离子体的架构[18],具有前所未有的灵活性和通用性。这个成果不仅有助于研究受控核聚变,也为更高效的物理模拟提供了新的思路。
四、 未来:人工智能引领新范式
(一)范式转换
在前文列举的种种AI for science的成果中,我们已经能感受到人工智能强大的威力以及其对现代物理学深远的影响。因此,人工智能可能会引发学科范式的深刻变革。这种变革不仅仅体现在工具的使用上,更可能涉及到整个科学研究方法论的重新定义和构建,乃至对科学哲学的根本挑战。
“范式”这一概念最早由美国科学哲学家托马斯·库恩(Thomas Samuel Kuhn)在其经典著作《科学革命的结构》[19]中提出。库恩认为,科学的进步不是完全通过渐进的积累过程实现的,而是通过一种革命性的“范式转变”来推动的。在特定历史时期,某一学科或领域内的学术共同体会广泛接受一套特定的假设、理论、方法和思维方式,这一套理论和方法构成了该学科的“范式”。范式不仅指导着科学家们如何观察世界,如何提出问题,如何解决问题,甚至决定了科学研究的边界和有效性。
纵观物理学几千年的发展历史,重要的范式转变可谓屈指可数。古代的自然哲学逐步演变为经典力学,随后的电磁学理论进一步推动了物理学的发展,20世纪初,相对论和量子力学的出现,更是彻底改变了我们对宇宙和物质的理解。每一次范式的变革,都彻底刷新着我们的直觉,代表着我们对世界认知的一个巨大的飞跃。
然而,正如库恩所指出,任何一个范式都无法完美地描述客观世界的全貌。无论是牛顿的经典力学,还是爱因斯坦的相对论,亦或是量子力学的基本原理,均无法做到对现实世界的彻底揭示。科学家一直在追寻一个“大一统理论”,期望通过一个完整的理论框架,将自然界的所有现象统一在一个理论之下。然而,科学史的经验告诉我们,这个理想的目标仍然遥不可及。爱因斯坦的前人未能发现相对论,并非仅仅因为他们缺乏足够的天赋或者没有遇到适当的机遇,更多的是因为“时间和空间独立”的假设本身,是建立在符合人类直觉的前提之上的。而这种基于直觉的假设,往往限制了我们对更深层次规律的理解。
(二)人工智能是未来趋势
对于人类来说,直觉是一种强大的认知工具,它帮助我们迅速做出决策,理解我们周围的世界。传统科学研究通常是依赖于人类的直觉和启发式思维。然而,那些科学上的重要发现,往往要求我们跳出直觉的束缚,去追求那些超出我们日常经验的真理。许多重要的理论突破,并非源自于直觉,而是来自于反直觉思维和实验数据的严谨分析。
人们总是愿意相信宇宙遵循奥卡姆剃刀原理,但种种迹象(例如标准模型)已经表明,真理未必是简洁优雅的。或许,科学家依赖直觉构建模型,本身就是不科学的。相反,基于深度学习的神经网络,擅长在海量数据中挖掘复杂的模式和特征,这种能力恰好弥补了人类直觉的不足。它能够在没有先验理论假设的情况下,通过数据驱动的方式逐步逼近真理,甚至发现我们未曾想到的科学问题和研究方向。
这便是人工智能所展现出的独特物理直觉。这种直觉不同于人类的直觉,但是二者相辅相成、缺一不可。随着未来人工智能技术不断突破,它在物理学研究中扮演的角色,或许将逐渐从辅助者转变为发现者。
(三)科学研究智能化、自动化
从这个角度来看,人工智能不仅仅是一个工具,它可能成为科学研究的核心推动力。随着人工智能技术的飞速发展,我们或许正面临着一个新的科学范式转变的契机。在新的科学范式中,人工智能将充当主体。这一范式便是科学研究的智能化、自动化。
这意味着人工智能将成为科研工作中不可或缺的合作伙伴,帮助科学家们跨越认知的局限,发现前所未见的科学规律。这种由人工智能主导的科学研究方式,可能会彻底改变我们对科学工作者的定义。在未来的科学工作中,科学家们可能不再是单纯的“实验员”或“理论家”,他们更多地将充当人工智能的设计者、引导者和监督者,提供问题的框架和方向,而具体的研究任务则由人工智能来完成。这一转变或许是科学研究历史上最深刻的革命,它将推动科学突破的速度和深度,以前所未有的方式改变我们的世界。
引人思考的是,在这种高度智能化的科研环境下,诺贝尔奖是否还会继续沿用以前的评选方式?如果人工智能在未来的科学研究中扮演着举足轻重的角色,那么,是否应该将诺贝尔奖授予人工智能本身呢?在一个人工智能主导的科学时代,诺贝尔奖可能会被重新定义,甚至形成一种全新的科研奖项评选标准。
根据托马斯·库恩的范式理论,范式的转换往往伴随着一场科学革命。也许,人工智能引领的这一场科学革命,已经悄然拉开了序幕。而2024年的诺贝尔物理学奖,正是该变革的第一个舞台。
五、 总结
人工智能的快速发展正在深刻地改变着我们社会的方方面面,从智能助手的普及到医疗诊断的辅助,从自动驾驶汽车到科学研究中的新工具,这些应用不仅在提高生产效率和人们的生活质量,更在推动着科学探索本身的发展。而这一切,正是物理学通过人工智能这一载体,在新时代为人类文明带来的福祉。从这个角度来讲,人工智能是物理学历史上最伟大的发明之一。
2024年的诺贝尔物理学奖,不仅不是对物理学的“摧毁”,反而是宣告了物理学进入新时代。在这一新时代中,无数的研究成果若脱离人工智能则不可能成功。科学的边界将不断扩展,研究的速度将不断加快,真理的发现将变得更加复杂且多元化。我们唯一能做的,就是不断适应并引领这一变化,拥抱人工智能带来的无限可能。
[①] The Nobel Prize in Physics 2024. NobelPrize.org. Nobel Prize Outreach AB 2024. Wed. 9 Oct 2024. <https://www.nobelprize.org/prizes/physics/2024/summary/>
[②] 南方周末. (2024, November 22). 2024年诺贝尔物理学奖的跨学科争议:人工智能还是物理学? 南方周末. Retrieved from https://www.infzm.com/contents/280372
[③] Jonathan Pritchard, https://x.com/jr_pritchard/status/1843590159411097902
[④] The 2024 Nobel Prize in Physics Did Not Go To Physics -- This Physicist is very surprised, https://www.youtube.com/watch?v=dR1ncz-Lozc
[⑤] CBC News. "AI Pioneers Geoffrey Hinton, John Hopfield Share Nobel Prize in Physics for Work on Neural Networks." CBC, 9 Oct. 2023, www.cbc.ca/lite/story/1.7344607.
[⑥] Geoffrey Hinton – Interview. NobelPrize.org. Nobel Prize Outreach AB 2024. Wed. 9 Oct 2024. <https://www.nobelprize.org/prizes/physics/2024/hinton/interview/>
[⑦] Deep connections: why two AI pioneers won the Nobel Prize for Physics, https://physicsworld.com/a/deep-connections-why-two-ai-pioneers-won-the-nobel-prize-for-physics/
[⑧] Hopfield, J. J. (n.d.). Now What? Princeton Neuroscience Institute. Retrieved from https://pni.princeton.edu/sites/g/files/toruqf321/files/documents/John%20Hopfield%20Now%20What%203_0.pdf
[⑨] Brady, Henry E. "The challenge of big data and data science." Annual Review of Political Science 22.1 (2019): 297-323.
[⑩] Alves, Alexandre. "Stacking machine learning classifiers to identify Higgs bosons at the LHC." Journal of Instrumentation 12.05 (2017): T05005.
[11] Azhari, Mourad, et al. "Higgs boson discovery using machine learning methods with pyspark." Procedia Computer Science 170 (2020): 1141-1146.
[12] Shallue, Christopher J., and Andrew Vanderburg. "Identifying exoplanets with deep learning: A five-planet resonant chain around kepler-80 and an eighth planet around kepler-90." The Astronomical Journal 155.2 (2018): 94.
[13] Koch-Janusz, Maciej, and Zohar Ringel. "Mutual information, neural networks and the renormalization group." Nature Physics 14.6 (2018): 578-582.
[14] Li, Shuo-Hui, and Lei Wang. "Neural network renormalization group." Physical review letters 121.26 (2018): 260601.
[15] Pathak, Jaideep, et al. "Using machine learning to replicate chaotic attractors and calculate Lyapunov exponents from data." Chaos: An Interdisciplinary Journal of Nonlinear Science 27.12 (2017).
[16] Pathak, Jaideep, et al. "Model-free prediction of large spatiotemporally chaotic systems from data: A reservoir computing approach." Physical review letters 120.2 (2018): 024102.
[17] Carifio, Jonathan, et al. "Machine learning in the string landscape." Journal of High Energy Physics 2017.9 (2017): 1-36.
[18] Degrave, Jonas, et al. "Magnetic control of tokamak plasmas through deep reinforcement learning." Nature 602.7897 (2022): 414-419.
[19] 托马斯·库恩. 科学革命的结构[M]. 北京大学出版社, 2012.

浙公网安备 33010602011771号