量子力学01 概率振幅

20世纪人们意识到经典力学不足以描述自然界的所有规律。在微小尺度下事物的行为一点也不像我们有着直接经验的任何事物,因为一切人类的直接经验和所有的人类直觉都只适用于大的物体。通过大量的实验和理论的探索,人们建立起了量子力学理论。到目前为止,这套理论在“原子核外”还没有发现例外,因此可以看作自然界最基本的运行法则。原则上,量子力学可以解释原子核外的一切现象(生命或非生命的)。

电子双缝干涉实验

根据物理学的观点,世界是由基本粒子构成的。这些基本粒子包括电子、质子、中子等等。首先,让我们研究电子的行为。

考虑下面这个称为“电子的双缝干涉”的实验。我们有一台电子发射器,它会朝某一范围的方向发射电子。发射器前方放置一个双缝,每个缝的宽度略宽于电子,保证电子能通过。双缝后放置带有探测器的屏组成,探测器可以测出电子到达屏上的位置。如果我们发射大量电子,那么对于每个位置,我们就可以通过计算探测器探测到的电子数除以总电子数,计算出电子到达每一位置的概率。

作为在宏观世界生活的人,我们会预期实验结果如何呢?让我们先基于宏观实验做一些猜测:

假如我们发射的不是电子而是完整不可分割的小球(宏观物体),发射的角度随机分布在一定范围内。那么作为实验结果,我们将得到一条小球数关于横向偏移距离的曲线。显然曲线一定是对称的,因为装置是对称的。并且,一个可能的结果是,对称轴处是最大值,然后向两侧递减。这条曲线的形状如何并不重要,我们不妨假设在对称轴处确实是最大值。关键在于,这条曲线还可以这样被绘出:假设我们刻意挡住第二个缝,重复实验,那么只有那些通过缝1的小球到达了探测器。这时,屏上有小球到达的位置总体偏向缝1;对称地,如果挡住缝1,那么屏上有小球到达的位置偏向缝2。一个重要的事实是,每个到达屏上的小球要么是通过缝1到达要么是通过缝2到达。所以当我们同时打开两个缝时,得到的结果应当恰好是依次堵住其中一个缝的结果之和。设挡住缝2时击中频次关于位置的曲线是\(P_1(x)\),挡住缝1时击中频次关于位置的曲线是\(P_2(x)\),那么当同时打开双缝时频次关于位置的曲线就是\(P_{12}(x)=P_1(x)+P_2(x)\)。在每一点处除以总小球数,我们就得到了一条概率的曲线。于是根据全概率公式,屏上每个位置有小球到达的概率 = 该位置有小球通过缝1到达的概率+该位置有小球通过缝2到达的概率。这种概率可加性源于实验的对象是“粒子(particle)”,宏观世界里到达屏上的粒子要么是通过缝1达到的,要么是通过缝2到达的,没有其它可能性。

image-20250514195408145

假如整个装置位于水中,发射器是水波的振动波源,探测器探测波的振动强度的装置。因为缝的宽度远小于水振动的波长,我们可以忽略衍射的效应,这样每个缝就可以看作一个新的波源(缝隙处的所有位置可以有相同的相位)。这两个波源发出的波会发成干涉,探测器处如果恰好是振动加强点则探测到波的强度高,如果是振动相消点则波的强度低。于是,最终屏上的曲线显示出强弱强弱不断起伏的曲线(干涉条纹)。现在,我们像小球的实验那样试着堵住一个缝重复这个水波的实验。如果堵住缝2,那么屏探测到的强度就是单个波源1产生的能量强度,这个强度反比于到波源的距离的平方,在靠近缝1处取最大值,向两侧递减,形状和刚才划出的单缝通过小球的曲线很相似;对称地,堵住缝1得到的曲线偏向缝2。但是,这两条曲线相加并不会得到干涉条纹的振动曲线。和粒子不同,屏上某一点的波的强度既受到缝1产生的波的作用,又受到缝2产生的波的作用。这种叠加可以用三角函数的和差化积表示。更一般地,可以用复数的实部表示。对于屏上的一点\(x\),设堵住缝2时该位置处波的高度随时间变化的函数为\(h_1(x)e^{i\omega t}\)的实部,堵住缝2时该位置处波的高度随时间变化的函数为\(h_2(x)e^{i\omega t}\)的实部。注意,\(h_1(x),h_2(x)\)也是复数,它们包含相位的信息(相位也即\(t=0\)时的振幅,也就是\(h_1,h_2\))。当两个缝同时打开时,振幅满足叠加原理,所以该位置波的高度随时间变化的函数为\((h_1(x)+h_2(x))e^{i\omega t}\)的实部。波的强度正比于波的高度瞬时值的均平方平均值。对于任意复数\(h\),设\(h=a+bi\),有\(he^{i\omega t}=(a+bi)(\cos\omega t+i\sin\omega t)\),它的实部为\(a\cos\omega t-b\sin\omega t\),其平方平均值\(\dfrac{1}{2\pi/\omega}\displaystyle\int_0^{2\pi/\omega}(a\cos\omega t-b\sin \omega t)^2\text{ d}t=\dfrac{a^2+b^2}{2}= \dfrac{|h|^2}{2}\propto |h|^2\)。由此可见,对于屏上的任意一个位置\(x\),如果来自缝1的波动强度为\(I_1(x)=|h_1(x)|^2/2\),来自缝2的波动强度为\(I_2(x)=|h_2(x)|^2/2\),那么振动叠加后的波动强度应当为\(I_{12}(x)=|h_1(x)+h_2(x)|^2/2=I_1(x)+I_2(x)\)。由此可见,某一位置在双缝同时打开时的波动强度并不等于只打开单缝时的波动强度的叠加。如果要从“叠加”的角度看这个问题,我们必须先把描述相位和振幅的函数\(h\)叠加,然后再计算波的强度。

image-20250514201120741

那么电子的双缝干涉实验结果如何呢?必须指出,这是一个理想实验,因为这样的装置小到几乎制造不出来,但是许多已经得到证实的其它实验能够确保这个理想实验一定会呈现下面的结果:探测器探测到的电子到达概率关于位置的曲线是干涉曲线,就像水波的实验中得到的那样。并且,依次堵住一个缝得到的概率曲线的形状也和水波的实验中单个波源的曲线相同,这两条曲线相加并不等于干涉曲线。

image-20250514223307337

注意,即便我们保证电子的每一次发射之间相隔足够长的时间,概率曲线的结果依然如上图所示。探测器总是探测到完整的一颗电子,这体现出电子的“粒子性(particle nature)”;而电子的概率曲线却和水波实验的概率曲线吻合,这体现出电子的“波动性(wave nature)”。于是人们把电子的这种奇特行为成为“波粒二象性(wave-particle duality)”。

电子双缝干涉的实验意味着以下这一事实是毋庸置疑的:电子的行为并不能类比宏观粒子的行为,“每个电子要么通过缝1要么通过缝2”并不成立,否则一定有\(P_{12}(x)=P_1(x)+P_2(x)\)

如果可以监测电子究竟是通过了哪个缝,我们就可以用实验验证“每个电子要么通过缝1要么通过缝2”这一命题究竟是否成立。然而,人们在这样的监测实验中遇到了巨大的困难。由于电子是尺度如此之小的物理对象,任何用于“监测”的实验装置都会干扰实验过程。屏上的探测器之所以可以准确测出是否有电子到达是由于我们可以用一个装置捕获电子(比如盖格米勒计数器),但是“监测”要求在不改变电子的运动的前提下确定电子的位置。任何这样的行为都要求我们向电子发射电磁波,再由电子散射此电磁波,我们再根据得到的电磁波推出电子的位置。人们实验发现,任何时候,只要监测装置能测出电子通过了哪一条缝,干涉结果就会被干扰, 以至于\(P_{12}(x)=P_1(x)+P_2(x)\)恰好被满足了;然而当我们慢慢降低监测的电磁波强度,以至于干涉曲线再度出现时,电磁波的强度恰好弱到无法判断电子通过了哪一个缝。最后人们不得不承认,以下现象是一条普遍的规律:“不可能设计出一种装置,既能够确定电子经过哪一个缝,又不使电子受到足以破坏其干涉图像的扰动”。海森堡提出,如果把以下原理作为宇宙的一条基本定律,那么电子双缝干涉的实验结果就能够自洽了:“不可能设计出一种装置,能够同时“准确”测定一个粒子的位置和动量。具体地,在同一时刻对任意客体进行动量\(p\)和位置\(x\)的测量时,测量的不确定性\(\Delta p\)\(\Delta x\)始终满足\(\Delta p\Delta x\geq\dfrac{\hbar}{2}\)。其中\(\hbar\)称为约化普朗克常量(reduced planck constant),其值近似等于$1.05\times 10^{-34}\text{ J \(\cdot\) s}\(”。也就是说一旦我们确定了某一粒子的位置在某一点附近不超过\)\Delta x\(的范围内,那么位置测量<u>产生的干扰</u>会使得我们永远不可能设计出一套装置来使其测得的动量比\)\dfrac{\hbar}{2\Delta x}\(更精确。这条定律称为“不确定性原理”或“测不准原理”(Uncertainty Principle)。在以上实验中,由于电子在运动中没有受到任何其它力的干扰,如果同时知道电子通过了哪一条缝以及最终落在屏上的那里,我们其实就已经极其精确地测出了电子通过缝的一瞬间的位置和动量了。实验确实证明这是不可能的,因为一旦测出每个电子通过了哪条缝,结果就一定会满足\)P_{12}(x)=P_1(x)+P_2(x)$,这与实验不符。

不确定性原理是大量实验总结出来的结论。对于这样的结论,我们自然要追问它的背后有没有更本质的东西。然而到目前为止,并没有任何比不确定性原理更本质的原理,不确定性原理本身就是所有的量子力学理论的基本假设。一旦推翻了不确定性原理,我们就将推翻整个量子力学。目前还没有一个人找到一条绕过不确定性原理来研究量子力学的途径。所以,我们不妨假设它就是自然界的一个基本特征:自然界中我们有能力获取的关于位置和动量的信息并不能精确到数轴上的一个点,而只能精确到某一个很小的区间。从这一点看来,人类对自然界的认识从根本上是“量子化(quantized)”的,而不是连续的。

概率振幅\(\newcommand{\l}{\lang}\newcommand{\r}{\rang}\)(Probability Amplitudes)

人们自然会质疑,是不是电子做了复杂的运动,以至于先通过缝1再通过缝2然后运动到屏上。然而任何关于这方面的尝试都无法与实验相符。然而,一个简单的数学模型却取得了巨大的成功:既然电子双缝干涉的结果和水波的实验完全相同,那么不妨假设有两个关于位置\(x\)的复函数\(\phi_1(x),\phi_2(x)\),使得堵住一条缝的概率曲线\(P_1(x),P_2(x)\)恰好满足\(P_1(x)=|\phi_1(x)|^2,P_2(x)=|\phi(x)^2|\)。这样,我们就可以通过先叠加这两个复数在求其模长平方的方式求出电子双缝干涉结果的概率,\(P_{12}(x)=|\phi_1(x)+\phi_2(x)|^2\)

注意,\(\phi\)是复数,所以并不成立\(\phi=\sqrt{P}\)。在水波的实验中,我们是为了计算方便才引入复数的。但在微观现象中,我们将会发现必须引入复数。

这一模型在大量实验中与事实吻合,以至于这种对通过设定复函数描述粒子行为的方法成为量子学中的基本方法。微观粒子的行为在数学形式上和波的行为同构,所以把粒子“想象为波”就变得非常有助于理解。那么,函数\(\phi(x)\)有什么具体含义吗?在水波实验中,函数\(h(x)\)描述振动的幅度以及相位,\(|h(x)|^2\)能够给出每个位置的波动强度。在电子双缝干涉实验中,\(|\phi(x)|^2\)可以给出电子出现在每个位置的概率,而在我们的类比中波动强度恰好对应于电子的概率,所以\(\phi(x)\)可以看作某种“振幅”。当然,电子并没有真的在振动,这只是我们为了类比波动而为函数\(\phi(x)\)所取的名字。我们把它称为“概率振幅(probability amplitude)”,简称“概率幅”或“振幅”。

基本原理

我们把一组特定的初始条件和最终条件称为一个“事件(event)”。例如,在电子双缝干涉的实验中,“一个电子从发射器出发,到达屏上的位置\(x\)”是一个事件;“一个电子从发射器出发,经过小孔1到达屏上的位置\(x\)”也是一个事件。量子力学的第一原理:事件的概率等于概率振幅的模长平方。

在电子双缝干涉的实验中,把发射器的位置矢量用\(s\)表示,探测器的位置矢量用\(x\)表示。我们用狄拉克的符号把概率振幅函数简记为\(\l x\mid s\r\)。实验结果显示,两个小孔同时打开时的概率曲线并不等于每个小孔单独打开时的概率曲线的和,而两个小孔同时打开时的概率振幅恰好等于每个小孔单独打开时的概率振幅的和。用狄拉克的符号表示为:\(\l x\mid s\r_{\text{两个小孔都打开}}=\)\(\l x\mid s\r_\text{只打开1}+\l x\mid s\r_\text{只打开2}\)。量子力学的第二原理:当多个事件可能同时发生并且无法测定究竟是哪个事件发生时,为了计算每个事件发生的概率,不应该单独计算每个事件发生的概率然后叠加,而是应该单独计算每个事件的概率振幅,叠加概率振幅以后计算概率(概率振幅模长的平方)。

尽管在电子双缝干涉实验中,我们永远无法知道一个电子是穿过了小孔1还是小孔2还是同时穿过小孔1和2,我们还是可以从形式上定义“电子从\(s\)到达小孔1”和“电子从小孔1到达\(x\)”这样的事件,这样的事件也可以用狄拉克符号记为\(\l 1\mid s\r\)\(\l x\mid 1\r\)。为这样的事件,我们用链式乘积的方式定义其概率幅,把这一定义作为量子力学的第三原理:一粒子走过某特定路径的概率振幅可以写成走过前后两部分路径的概率振幅的乘积。例如,有\(\l x\mid s\r_\text{只打开1}=\l x\mid 1\r \l 1\mid s\r\)。那么\(\l x\mid s\r_\text{两个小孔都打开}=\l x\mid 1\r \l 1\mid s\r+\l x\mid 2\r \l 2\mid s\r\)。第三原理让量子力学的分析只依赖于某一初始状态的概率振幅,而不必了解在此之前的任意信息。

当涉及多个粒子的时候,还有一条额外的原理:如果两个粒子不相互作用,那么一个粒子做一件事并且另一个粒子做另一件事的振幅是两个粒子分别做这两件事的振幅的乘积,这类似于概率论中事件的独立性。

薛定谔方程(Schrödinger Equation)

最一般的情况下,事件的概率振幅\(\psi\)是一个关于时间\(t\)和位置\(\vec r\)的函数。薛定谔方程描述了非相对论情况下概率振幅与系统能量分布\(V\)的关系。写作:

\[i\hbar \dfrac{\part \psi}{\part t}=-\dfrac{\hbar}{2m}\nabla^2 \psi+V\psi \]

已知系统能量分布时,通过求解薛定谔方程就可以得到某初始时间和位置的粒子在未来的各位置处的概率振幅。

在电子双缝干涉实验中,“从源到孔1”以及“从孔1到\(x\)”的过程中,电子都不受任何力的作用,匀速从真空中一点\(\vec r_1\)运动到真空中另一点\(\vec r_2\)。通过解薛定谔方程可以求出\(\l \vec r_2 \mid \vec r_1\r = C \cdot \dfrac{\exp\left(\dfrac{i}{\hbar}\vec p\cdot (\vec r_2-\vec r_1)\right)}{|\vec r_2-\vec r_1|}\),其中\(\vec p\)是粒子的动量。在电子双缝干涉的实验中,动量和位移始终是共线的。所以当我们假定发射器发射出的电子的能量一定时,可以用\(p^2=2mE\)计算出\(|p|=\sqrt{2mE}\),那么我们可以解出电子双缝干涉过程中的所有事件的概率振幅了(这里我们假设了粒子进出小孔的概率振幅为\(1\),也即忽略小孔对电子行为的影响):设\(s\)到双缝的距离为\(l\),双缝间距为\(2d\),双缝到屏的距离为\(L\),那么\(\l x\mid s\r_\text{两个小孔都打开}=\l x\mid 1\r \l 1\mid s\r+\l x\mid 2\r \l 2\mid s\r\)\(=\dfrac{\exp(\dfrac{i}{\hbar}\sqrt{2mE}(\sqrt{d^2+l^2}+\sqrt{(x-d)^2+L^2}))}{\sqrt{(d^2+l^2)[(x-d)^2+L^2]}}+\dfrac{\exp(\dfrac{i}{\hbar}\sqrt{2mE}(\sqrt{d^2+l^2}+\sqrt{(x+d)^2+L^2}))}{\sqrt{(d^2+l^2)[(x+d)^2+L^2]}}\)。计算此概率振幅的平方,就会得到和水波实验中一样的干涉曲线。

监测实验的分析

有了这些原理,我们可以分析用光源\(L\)观测电子时双缝干涉实验结果的概率幅。电子会散射光子。假设我们在孔1和孔2后同时对称地放置光子探测器\(D_1\)\(D_2\)。根据相乘的法则,电子从发射源\(s\)出发到达孔1的振幅为\(\l 1\mid s\r\),此时散射光子使得光子到达\(D_1\),这一事件的振幅设为\(a\),而后从孔1到达屏上的振幅为\(\l x\mid 1\r\)。因此总的振幅(从右往左)为\(\l x\mid 1\r a\l 1\mid s\r\)。把\(\l x\mid 1 \r\l 1 \mid s \r\)记为\(\phi_1\),得到\(a\phi_1\)。同时,通过孔2的电子也可能把光子散射进\(D_1\)里(尽管可能性很小),记孔2的电子散射进\(D_1\)的概率幅为\(b\),那么“电子从\(s\)到达孔2,散射的光子被\(D_1\)探测,最后到达\(x\)”的概率幅为\(\l x \mid 2\r b \l 2 \mid s\r\),记为\(b\phi_2\)。所以,\(\l 电子到x且光子到D_1\mid s\r=a\phi_1+b\phi_2\)。同样地,也可以计算\(\l 电子到x且光子到D_2\mid s\r=a\phi_2+b\phi_1\)。由于我们构建的系统是对称的,所以通过孔1的电子散射光子到\(D_2\)的概率幅应当等于通过孔2的电子散射光子到\(D_1\)的概率幅,孔2的电子散射光子到\(D_2\)的概率幅应当等于通过孔1的电子散射光子到\(D_1\)的概率幅。因此\(\l 电子到x且光子到D_2\mid s\r=a\phi_2+b\phi_1\)

现在, 一个在监测实验中起作用的装置应该满足:经过孔1的电子只会散射光子到\(D_1\),不会散射光子到\(D_2\)。这意味着概率幅\(b=0\)。每个电子发射后,总是要么\(D_1\)接收到光子要么\(D_2\)接收到光子,这两个事件是可区分的,所以最后得到的概率曲线为\(|a\phi_1+b\phi_2|^2+|a\phi_2+b\phi_1|^2=2|a|^2|(\phi_1|^2+|\phi_2|^2)\),可见这恰好是堵住每个小孔时的概率曲线的叠加,电子没有发生干涉。

如果我们减弱光子的能量(增加波长),直到光线模糊得无法分辨电子是通过了孔1还是孔2,此时\(a,b\)变得非常接近。不妨设\(a=b\),此时概率曲线为\(|a\phi_1+b\phi_2|^2+|a\phi_2+b\phi_1|^2=2|a\phi_1+a\phi_2|^2=2|a|^2|\phi_1+\phi_2|^2\),可见此时概率幅叠加,电子发生干涉。

很重要的一点是,由于“是\(D_1\)接收到光子还是\(D_2\)接收到光子”在任何时候都是可区分的事件,无论该光子是在小孔1被散射还是在小孔2被散射。对于可以区分的事件,总是不满足概率幅的叠加而是满足概率的叠加。两个事件是否可以区分不在于观察者是否有“想要区分”的意图,而在于区分这两个事件是否会违反不确定性原理。

posted @ 2025-05-15 18:32  行而上  阅读(54)  评论(0)    收藏  举报