狭义相对论

经典力学对物理世界做出了两个假设:

  • 时间是独立于空间与任何物体的、均匀流逝着的物理量;
  • 质量是每个物体固有的、不随物体运动而改变的属性;

牛顿定律经受了长期的时间检验并保持正确,精确地预测了许多天文现象。直到有关电与磁的研究出现,人们才第一次发现违背牛顿定律的现象。电与磁的研究把我们从低速的世界带向了高速的世界。在高速的世界,物理规律有所不同。

在经典力学中,当我们谈论速度、加速度时,我们指的是一个有质量的物体相对于选定的参照物的位移关于“时间”的一阶导函数、二阶导函数。但是,在高速的世界,我们必须特别注意我们的用词,因为我们在低速下的生活中建立起来的关于“时间”、“空间”、“速度”、“质量”等观念的经验,往往是错误的。我们必须从数学出发,建立对这些概念的精确定义,才能得出正确的描述高速世界的物理规律。

相对性原理

伽利略变换

牛顿力学中把时间看作“独立于空间的均匀流逝的对象”导致了一个非常重要推论,称为相对性原理。相对性原理可以这样表述:假设我们身处一个封闭的车厢,而车厢相对于参照物(比如大地)做匀速运动,那么在匀速运动的车厢“内部”所发生的一切物理现象,应该与“当车厢相对大地静止”时完全相同。换言之,我们永远无法凭借车厢内的现象分辨车厢相对于地面是静止还是匀速运动(当然,我们可以做的是分辨车厢是否在做加速运动)。实验也确实验证了相对性原理的正确性。这说明,只有在选定参照物之后才可以讨论“运动”,“绝对的运动”是不存在的。

例如,我们在车厢内释放小球,小球相对车厢做自由落体运动。假定车厢相对于地面静止,那么我们可以选定地面上的一个参照物,以该参照物为坐标原点建立空间直角坐标系(称为参考系),记为\(S\)。不失一般性,假设小球在\(S\)的原点被释放,沿\(z\)轴负方向运动一秒钟后落地。那么该过程中小球的坐标随时间\(t\)变化的过程为\((0,0,-\dfrac{1}{2}gt^2)\)。现在假定车厢是相对于地面做匀速运动的,设车厢沿\(x\)轴正方向以速度\(u\)运动。依然假设小球在时间\(t=0\)被释放,此时小球具有\(x\)方向的初速度\(u\),因此做平抛运动,其运动过程是\((ut,0,-\dfrac{1}{2}gt^2)\)。在车厢运动的情况中,我们可以选定车厢上的一个相对于车厢静止的物体建立空间直角坐标系,记为\(S'\)。不失一般性,假设\(S'\)\(t=0\)时和\(S\)是重合的。于是,在\(S'\)下小球的运动过程又变回了\((0,0,-\dfrac{1}{2}gt^2)\)。这就是“车厢内部的物理现象和静止时相同”的含义。

通过自由落体的例子我们看到,一个运动现象可以由四元组\((x,y,z,t)\)的集合来描述。例如,小球的自由落体现象可以用集合\(\{(0,0,-\dfrac{1}{2}gt^2,t)\mid 0\leq t\leq 1\}\)得到描述。我们把这个集合中的每个元素称为一个事件,一个事件就是一个四元组\((x,y,z,t)\)。例如,\((0,0,-g/2,1)\)是小球自由落体现象中的一个事件,它表示“小球在\(t=1\)时占据\((0,0,-g/2)\)处的空间”。一个运动现象是不依赖于参考系而客观存在的,而当参考系不同时,用来表示现象的事件集合会有所不同。在描述一个现象的时候,如果把参考系由\(S\)改为\(S'\),那么每一个事件都要发生相应的修改。特别地,当\(S'\)\(S\)\(t=0\)时重合,并且\(S'\)相对\(S\)沿\(x\)正方向以速度\(u\)匀速运动时,\(S\)中的事件\((x,y,z,t)\)\(S'\)中的事件\((x',y',z',t')\)的变换为:

\[\begin{aligned} x'&=x-ut\\ y'&=y\\ z'&=z\\ t'&=t \end{aligned} \]

这称为“伽利略变换”。在对一个事件做伽利略变换时,时间维度不变,空间维度叠加时刻\(t\)时参考系的相对位移。

洛伦兹变换

相对性原理是实验的结论,在大量实践中都发现静止时的物理现象和匀速运动时的物理现象是完全相同的。实践表明,这一结论对于电磁学现象也应当成立。

例如,当车厢相对地面静止时,在车厢正中央同时沿车厢向前后发射激光,车厢内的人观察到激光同时到达墙壁;那么,根据相对性原理,当车厢相对地面匀速前进时,车厢内的人也将观察到两束激光同时到达墙壁。但是,这会导致一个看似奇怪的结果。根据麦克斯韦方程组,光的速度相对于任何参照物都始终为恒定大小\(c\)。那么对于地面上的观察者(其参考系为\(S\))来说,假设车厢沿\(u\)的速度沿\(S\)\(x\)轴匀速运动,车厢的长度为\(2l\)\(t=0\)时刻车上的人位于车厢正中央,且该坐标为\((0,0,0)\)。设车厢上的观察者的参考系为\(S'\),它在\(t=0\)时刻原点也恰好位于车厢正中央。于是,车厢上的人在\(S'\)下观察到事件\((l,0,0,l/c),(-l,0,0,l/c)\),分别表示时刻\(l/t\)激光到达位置\((l,0,0)\)\((-l,0,0)\)。对这两个事件做伽利略变换(逆变换),得到地面观察者观察到的\(S\)下的两个事件\((l+uc,0,0,l/c),(-l+uc,0,0,l/c)\)。但是,这意味着对于地面观察者而言,两束光的速度分别为\(\dfrac{l+uc}{l/c}\)\(\dfrac{l-uc}{l/c}\)。这就与麦克斯韦方程组矛盾,前者甚至超过了光速\(c\)。所以,“麦克斯韦方程组”和“伽利略变换”肯定有一个是不正确的。

实验表明,错的不是麦克斯韦方程组,而是伽利略变换。伽利略变换只是在低速运动的物体的坐标变换的一个近似变换,而对于高速运动的物体则不再满足。然而,伽利略变换是建立在“时间是独立于空间的”这一基本假设之上的常识,所以这意味着我们必须打破“时间是独立于空间的”这一观念。时间与空间的独立性只是低速现象中的一个近似,它们本身从来不是独立存在的。

我们决定遵循的基本假设有两个(二者都是实验的结果):

  • 相对性原理始终成立;
  • 光速相对任何观察者都为\(c\)

基于此,我们来探究新的坐标变换的数学表述。

考虑一个简单的物理过程:在参考系\(S\)中,\(t=0\)时刻从原点沿\(x\)正方向发出一束光,该现象对应的事件集合为\(\{(ct,0,0,t)\mid t\geq 0\}\)。设参考系\(S'\)在0时刻与\(S\)重合,并相对于\(S\)以速度\(u\)沿\(x\)正方向运动。

我们已经知道伽利略变换是相对速度\(u\)远小于\(c\)时的一个近似变换。所以不妨猜测新的变换在关于\(x\)做变换时,只需在原来的基础上乘一个关于\(u\)的系数。更确切的说,我们希望这个系数是用于缩放的,所以它其实应当是一个关于\(|u|\)的系数。把这个系数设为\(\gamma\),我们猜测新的变换关于\(x\)的形式为\(x'=\gamma(x-ut)\)。现在,假设我们要做逆变换,也即从\(S'\)变换到\(S\),那么缩放因子应当不变,所以还应当满足\(x=\gamma(x'+ut')\)

进一步,我们猜测新的变换和伽利略变换一样是\(\R^4\)上的线性变换。那么\(x=0\)时应当变换得到\(x'=0\)\(t=0\)时应当变换得到\(t'=0\)。所以当\(S'\)上的人在\(t'=0\)时刻发射激光时,\(S\)上的观察者也在\(t=0\)时刻看到激光发射。根据经验常识,两束激光都应该沿\(x\)轴正方向以光速\(c\)运动,所以我们在\(S\)上有关系式\(x=ct\),在\(S'\)上有关系式\(x'=ct'\)

\(x=ct\)\(x'=ct'\)代入到\(x'=\gamma(x-ut)\)\(x=\gamma(x'+ut')\)中。消去\(x\)\(x'\),得到\(ct'=\gamma(ct-ut)\)\(ct=\gamma(ct'+ut')\)。再消去\(t\)\(t'\),解得\(\gamma=\dfrac{1}{\sqrt{1-u^2/c^2}}\)。于是我们得到了这样一个变换:

\[\begin{aligned} x'&=\dfrac{x-ut}{\sqrt{1-u^2/c^2}}\\ y'&=y\\ z'&=z\\ t'&=\dfrac{t-ux/c^2}{\sqrt{1-u^2/c^2}} \end{aligned} \]

这称为洛伦兹变换。其中\(\gamma\)称为洛伦兹因子。

注意,以上“推导过程”只是在解释人们最初是如何得到“洛伦兹变换”这一数学形式的,并不是严谨的数学推导。

实践表明,洛伦兹变换和实验结果完全相符,说明这就是正确的坐标变换方式。我们必须在不违反相对性原理、光速不变假设以及洛伦兹变换的前提下,对力学定律做出修正,并对修正做出解释。可以看到,洛伦兹变换把空间和时间混到了一起。因此为了理解这一变换,我们必须修正我们关于“时间”和“空间”的理解。

时间与空间的相对性

长度的相对性

\(t=0\)时参考系\(S\)与参考系\(S'\)重合,\(S'\)相对于\(S\)沿\(x\)轴正方向以速度\(u\)匀速运动。假设一把长度为\(l\)的尺子相对参考系\(S\)静止,平行于\(x\)轴放置在\(S\)下坐标\((p,0,0)\)\((p+l,0,0)\)处。那么,尺子的存在可以表示为\(S\)下的事件集合\(\{(x,0,0,t)\mid x \in [p,p+l], t\in \R\}\)。要想知道\(S'\)下观测到的尺子以何种方式存在,需要对该事件集做洛伦兹变换到参考系\(S'\)下,得到\(\{(\dfrac{x-ut}{\sqrt{1-u^2/c^2}},0,0,\dfrac{t-ux/c^2}{\sqrt{1-u^2/c^2}})\mid x\in [p,p+l],t\in \R\}\)

\(S'\)下尺子的长度还是\(l\)吗?由于现在时空已经发生了混合,我们需要首先明确“长度”这个词语的含义究竟是什么。我们把“长度”定义为任意时刻\(t_0\)尺子所占据的\(x\)轴上的空间范围,那么现在可以计算\(S'\)下尺子的长度。对\(S'\)下的任意时刻\(t_0\),我们要计算当等式\(t_0=\dfrac{t-ux/c^2}{\sqrt{1-u^2/c^2}}\)满足时,\(\dfrac{x-ut}{\sqrt{1-u^2/c^2}}\)的取值范围,其中参数\(x\in [p,p+l],t\in \R\)。用\(t_0\)消去\(t\),得到\(t=(\sqrt{1-u^2/c^2})t_0+ux/c^2\)。所以\(\dfrac{x-ut}{\sqrt{1-u^2/c^2}}=\dfrac{x-u((\sqrt{1-u^2/c^2})t_0+ux/c^2)}{\sqrt{1-u^2/c^2}}=(\sqrt{1-u^2/c^2})x-ut_0\)。由此可见时刻\(t_0\),尺子占据的空间范围用\(S'\)下的空间坐标表示为\(\{(\sqrt{1-u^2/c^2})x,0,0)\mid x\in [p,p+l]\}\)。可见任意时刻\(S'\)下观测到的尺子长度为\((\sqrt{1-u^2/c^2})\cdot l\)

上面这个结果可以表述为:当尺子沿着自身延展的方向相对观测者以速度\(u\)匀速运动时,观测者测出的尺子长度相对于静止时的长度需要乘上一个因子\(\sqrt{1-u^2/c^2}\)

由此可见,在相对论中,“长度”不再是物体固有的绝对属性,而是像“速度”一样相对于参考系才有意义的属性。

同时的相对性

我们再来考虑之前那个在车厢中央向前后发射激光的例子。设\(t=0\)时参考系\(S\)与参考系\(S'\)重合,\(S'\)相对于\(S\)沿\(x\)轴正方向以速度\(u\)匀速运动。设\(0\)时刻车厢中心位于原点,车厢沿\(x\)轴放置,相对于\(S'\)静止,静止时车厢总长度为\(2l\)\(0\)时刻车厢中心向前后发射激光,两束激光的事件集合在\(S'\)下分别为为\(\{(ct',0,0,t')\mid 0\leq t'\leq l/c\}\)\(\{(-ct',0,0,t')\mid 0\leq t'\leq l/c\}\)。要求得\(S\)下的事件集合,需要做洛伦兹逆变换(也即把\(u\)替换为\(-u\)),得到\(\{(\dfrac{ct'+ut'}{\sqrt{1-u^2/c^2}},0,0,\dfrac{t'+ut'/c}{\sqrt{1-u^2/c^2}})\mid 0\leq t'\leq l/c\}\)\(\{(\dfrac{-ct'+ut'}{\sqrt{1-u^2/c^2}},0,0,\dfrac{t'-ut'/c}{\sqrt{1-u^2/c^2}})\mid 0\leq t'\leq l/c\}\)

\(S\)参考系下,向前发射的激光有\(x=\dfrac{ct'+ut'}{\sqrt{1-u^2/c^2}},t=\dfrac{t'+ut'/c}{\sqrt{1-u^2/c^2}}\),所以\(x = ct\),的确满足光速不变假设。但我们注意到,在参数\(t'\)\(0\)增大到\(l/c\)的过程中,\(t\)\(0\)只增大到\(\left(\dfrac{1+u/c}{\sqrt{1-u^2/c^2}}\right)\cdot l/c\)。因为\(x,t\)都是关于\(t'\)单调的,所以对于\(S\)中的观察者而言,时刻\(\left(\dfrac{1+u/c}{\sqrt{1-u^2/c^2}}\right)\cdot l/c\)就是向前发射的激光击中墙壁的时刻。

同样地,向后发射的激光有\(x=\dfrac{-ct'+ut'}{\sqrt{1-u^2/c^2}},t=\dfrac{t'-ut'/c}{\sqrt{1-u^2/c^2}}\),所以\(x = -ct\)。但是,在参数\(t'\)\(0\)增大到\(l/c\)的过程中,\(t\)\(0\)只增大到\(\left(\dfrac{1-u/c}{\sqrt{1-u^2/c^2}}\right)\cdot l/c\)\(x,t\)都是关于\(t'\)单调的,所以对于\(S\)中的观察者而言,时刻\(\left(\dfrac{1-u/c}{\sqrt{1-u^2/c^2}}\right)\cdot l/c\)就是向后发射的激光击中墙壁的时刻。

可见,尽管对于车厢上的观察者而言,两束激光同时集中前面墙壁和后面墙壁,但是对于地面的观察者而言,这两件事却是不同时刻发生的。这就是运动导致的“同时”的相对性。在一个参考系下同时发生的事并不是在其它参考系下也是同时发生的。当我们使用“同时”这个词时,必须指明相对于哪个参考系“同时”。

时间间隔的相对性

\(t=0\)时参考系\(S\)与参考系\(S'\)重合,\(S'\)相对于\(S\)沿\(x\)轴正方向以速度\(u\)匀速运动。假设一个带着手表的人相对\(S'\)保持静止,始终位于\(S'\)\((x_0',y_0',z_0')\)。这个带着手表的人于\(S'\)参考系下的某时刻\(t_1'\)开始计时,直到\(t_2'\)时结束计时。那么“计时”这一过程对应事件集合为\(\{(x_0',y_0',z_0',t')\mid t'\in [t_1',t_2']\}\)。要求得\(S\)下的事件集合,需要做洛伦兹逆变换,得到\(\{(\dfrac{x_0'+ut'}{\sqrt{1-u^2/c^2}},y_0',z_0',\dfrac{t'+ux_0'/c^2}{\sqrt{1-u^2/c^2}})\mid t'\in [t_1',t_2']\}\)

所以,计时这一过程在\(S\)下经过的时间间隔为\(\dfrac{t'_2+ux_0'/c^2}{\sqrt{1-u^2/c^2}}-\dfrac{t'_1+ux_0'/c^2}{\sqrt{1-u^2/c^2}}\)\(=\dfrac{t'_2-t_1'}{\sqrt{1-u^2/c^2}}\)。相比于\(S'\)下的时间间隔\(t_2'-t_1'\)\(S\)下的时间间隔膨胀了。所以,从地面观察者看来,车厢里的人的表走的比他的表更慢。地面上的人看车厢里的人就好像慢动作一样。

但是,地面上的人看车厢里的人好像慢动作,并不意味着车厢里的人看地面上的人好像快动作。因为地面上的人相对于车厢里的人也是运动的,所以车厢里的人也应该看到地面上的人好像慢动作,车厢里的人会觉得地面上的人的表走得更慢。但是究竟谁的表走得更慢呢?我们必须意识到,这个问题本身是无意义的,因为我们不能在不同参考系下比较“快慢”。

那么,如果我们让车厢停下来,把两个人的表放到同一个参考系下作比较,会发生什么呢?这就是著名的孪生子佯谬:一对孪生子\(A\)\(B\)的年龄是相同的,如果\(A\)登上宇宙飞船以接近光速的速度飞行,\(B\)留在地球上,那么在\(B\)看来\(A\)的表走得更慢,所以当\(A\)重返地球时应该会发现\(A\)更年轻。但是,在\(A\)看来,\(B\)的表走的更慢,所以当\(A\)重返地球时应该会发现\(B\)更年轻。这就发生了矛盾。这是怎么回事?实际上,刚才讨论的时间膨胀效应在现在这个场景下已经不适用了。我们到目前为止只讨论了“匀速”的相对运动,而如果\(A\)要先以高速离开地球再回到地球站到\(B\)的身边和他比较年龄,就必须经历加速和减速的过程。而我们目前的讨论还尚不能得出相对加速或相对减速时表的快慢如何变化。事实上,上述过程假如真实发生了,的确会有一个人更年轻:孪生子\(A,B\)的处境并不是对称的,\(A\)参加了宇宙飞行,他在此过程中会受到用于加速、减速的力的作用。但是\(B\)一直在地球上,他的受力情况和\(A\)并不相同。经过正确的分析后(此刻我们尚不能给出正确的分析),我们将会知道是\(A\)更年轻。

速度的洛伦兹变换

在经典力学中,如果做参考系的变换,那么物体的运动速度在变换后需要叠加上参考系之间的相对速度。但显然这一点在相对论中不再成立。例如,如果在第一个参考系下物体速度为光速,而该参考系又相对另一个参考系以速度\(u\)运动,那么物体在另一个参考系下的速度不能是\(c+u\),这违反了光速不变假设。

我们基于洛伦兹变换来计算速度的变换法则。

首先考虑平行于参考系相对运动方向的速度分量的变换法则。设\(t=0\)时参考系\(S\)与参考系\(S'\)重合,\(S'\)相对于\(S\)沿\(x\)轴正方向以速度\(u\)匀速运动。假设在\(S'\)下,\(0\)时刻某物体位于坐标\((x_0',y_0',z_0')\),它沿\(x\)轴正方向以速度\(v'\)匀速运动。那么该事件集合为\(\{(x_0'+v't',y_0',z_0',t')\mid t'\in \R\}\)。做洛伦兹逆变换,得到\(S\)下的事件集合为\(\{(\dfrac{x_0'+v't'+ut'}{\sqrt{1-u^2/c^2}},y_0',z_0',\dfrac{t'+u(x_0'+v't')/c^2}{\sqrt{1-u^2/c^2}})\mid t'\in \R\}\)。可见,在\(S\)下物体的坐标满足关系式\(x=\dfrac{u+v'}{1+uv'/c^2}\cdot t + C_x\)。可见在坐标系\(S\)下物体的速度为\(v=\dfrac{u+v'}{1+uv'/c^2}\)。这就是新的速度叠加原理。在\(u\)\(v'\)都远小于光速时,\(uv/c^2\)可以忽略,这时就退化为伽利略的速度叠加原理。而比如\(u,v'\)都等于\(1/2c\)时,计算得到叠加后的速度为\(\dfrac{4}{5}c\)。当\(u\)\(c\)时,\(\dfrac{c+v'}{1+v'/c}=c\)

再来考虑垂直于参考系相对运动方向的速度分量的变换法则。设\(t=0\)时参考系\(S\)与参考系\(S'\)重合,\(S'\)相对于\(S\)沿\(x\)轴正方向以速度\(u\)匀速运动。假设在\(S'\)下,\(0\)时刻某物体位于坐标\((x_0',y_0',z_0')\),沿\(y\)轴正方向以速度\(v'\)匀速运动。那么该事件集合为\(\{(x_0',y_0'+v't',z_0',t')\mid t'\in \R\}\)。做洛伦兹逆变换,得到\(S\)下的事件集合为车\(\{(\dfrac{x_0'+ut'}{\sqrt{1-u^2/c^2}},y_0'+v't',z_0',\dfrac{t'+ux_0'/c^2}{\sqrt{1-u^2/c^2}})\mid t'\in \R\}\)。可见,在\(S\)下物体的坐标满足关系式\(x=u t + C_x\)\(y=\sqrt{1-u^2/c^2}\cdot v'+C_y\)。可见在坐标系\(S\)下物体的速度在\(x\)上的分量与\(S'\)的速度相同,而\(y\)上的分量会缩小一个\(\sqrt{1-u^2/c^2}\)的因子(这是需要引起注意的,因为它告诉我们不能认为垂直于参考系运动的方向上不会产生相对论效应)。

相对论下的质量

根据相对性原理的假设,能量守恒定律和动量守恒定律也应当在洛伦兹变换下保持成立。注意,因为涉及能量和动量,所以这里我们第一次涉及到了有关“质量”的讨论。对于这个概念,必须小心对待,尤其不能假设物体的质量关于一切参考系都相同。

为了尽可能避免涉及到“力”这个复杂的概念,我们研究“碰撞”这个问题。我们把物体的动量定义为物体的质量与物体速度矢量的乘积。选取参考系\(S\),假设两个完全相同的粒子以相同的速度大小以及相反的速度方向运动,发生完全弹性碰撞后弹开。由于系统不受外界干扰,所以两个例子的动量总和守恒。而碰撞前动量总和为\(\vec 0\),因此碰撞后动量总和依然为\(\vec 0\)。假设碰撞前后粒子的质量不变,速度大小也不变。我们并不假设碰撞是对心的,因此碰撞前后粒子的运动方向可能偏转了一个角度,我们把参考系\(S\)取在\(z\)轴与碰撞过程的对称轴重合,且碰撞发生在\(xOz\)平面上的位置。

image-20250729182449534

设粒子1的沿\(x\)方向的速度分量为\(u\),沿\(z\)方向的速度分量为\(w\)。设碰撞发生的时刻为\(t=0\)。于是,粒子1的运动事件集为\(\{(ut,0,wt,t)\mid t \leq 0\}\cup \{(ut,0,-wt,t)\mid t\geq 0\}\),粒子2的运动事件集为\(\{(-ut,0,-wt,t)\mid t \leq 0\}\cup \{(-ut,0,wt,t)\mid t\geq 0\}\)

现在我们取另一个参考系\(S'\)\(S'\)相对于\(S\)沿\(x\)轴正方向以速度\(u\)匀速运动,在\(0\)时刻两坐标系重合。于是根据洛伦兹变换计算出在\(S'\)下粒子1的运动事件集为\(\{(0,0,wt,\dfrac{t-u^2t/c^2}{\sqrt{1-u^2/c^2}})\mid t \leq 0\}\cup \{(0,0,-wt,\dfrac{t-u^2t/c^2}{\sqrt{1-u^2/c^2}})\mid t\geq 0\}\),粒子2的运动事件集为\(\{(\dfrac{-2ut}{\sqrt{1-u^2/c^2}},0,-wt,\dfrac{t+u^2t/c^2}{\sqrt{1-u^2/c^2}})\mid t \leq 0\}\cup \{(\dfrac{-2ut}{\sqrt{1-u^2/c^2}},0,wt,\dfrac{t+u^2t/c^2}{\sqrt{1-u^2/c^2}})\mid t\geq 0\}\)。可见,在\(S'\)坐标系下,粒子1沿\(x\)方向的速度大小\(v_{1x}'=0\),沿\(z\)方向的速度大小\(v_{1z}'=\dfrac{w}{\sqrt{1-u^2/c^2}}\);粒子2沿\(x\)方向的速度大小\(v_{2x}'=\dfrac{2u}{1+u^2/c^2}\),沿\(z\)方向的速度大小\(v_{2z}'=w\cdot \dfrac{\sqrt{1-u^2/c^2}}{1+u^2/c^2}\)

现在,动量守恒定律在\(S'\)中也要成立。设\(m_1',m_2'\)表示粒子1,2在参考系\(S'\)下的质量。那么根据在参考系\(S'\)\(z'\)轴上的动量守恒,有\(m_1'v_{1z}'-m_2'v_{2z}'=-m_1'v_{1z}'+m_2'v_{2z}'\),化简可得\(\dfrac{m_1'}{m_2'}=\dfrac{v_{2z}'}{v_{1z}'}=\dfrac{1-u^2/c^2}{1+u^2/c^2}\)。我们得出了一个结论:如果动量守恒定律要在\(S'\)下成立,那么势必意味着粒子1和粒子2在\(S'\)参考系下具有不同的质量!

于是,我们做出这样一个假定:“质量”并不是物体固有的属性,而是会随物体的速度变化而变化的。而因为“速度”依赖于参考系,因此“质量”也依赖于参考系。物体的质量是一个关于物体(相对于参照物的)速度的函数。根据这一假设,我们把\(m_1'\)记为\(m_{v_1'}\),把\(m_2'\)记为\(m_{v_2'}\)

由于在这里我们尚不清楚这种质量关于速度的依赖性是否与速度的方向有关,但我们不妨先假设质量与速度的方向无关,而后再来检验这样的假设是否正确。在这样的假设下,我们计算出\(S'\)中粒子1的合速度大小为\(v_1'=\dfrac{w}{\sqrt{1-u^2/c^2}}\),粒子2的合速度大小为\(v_2'=\dfrac{\sqrt{4u^2+w^2-u^2w^2/c^2}}{1+u^2/c^2}\)。注意到,恰好有\(\dfrac{m_{v_1'}}{m_{v_2'}}=\sqrt{1-\dfrac{4u^2}{(1+u^2/c^2)^2c^2}}=\dfrac{1-u^2/c^2}{1+u^2/c^2}\),因此可以写作\(\dfrac{m_{v_1'}}{m_{v_2'}}=\sqrt{1-(v_{2x}')^2 /c^2}\)

现在我们来做一点不绝对严谨的近似,来帮助我们导出有关质量的公式,然后再来检验这个公式的正确性。假如我们让\(w\to 0\),那么\(v_{2z}'=w\cdot \dfrac{\sqrt{1-u^2/c^2}}{1+u^2/c^2} \to 0\),根据由速度合成的关系\((v_2')^2=(v_{2x}')^2+(v'_{2z})^2\),可以认为\(v_2'\to v_{2x}'\)。既然我们假设了质量是关于速度的函数,所以可以认为\(m_{v_2'}\to m_{v_{2x}'}\)。而因为\(v_1'\leq w\),所以\(v_1'\to 0\),因此\(m_{v_1'}\to m_0\),其中\(m_0\)就是粒子静止时的质量。把这些极限代入\(\dfrac{m_{v_1'}}{m_{v_2'}}=\sqrt{1-(v_{2x}')^2 /c^2}\)中,我们就得到了这样一个数学形式,\(\dfrac{m_0}{m_{v_{2x}'}}=\sqrt{1-(v_{2x}' )^2/c^2}\)。可以看到,我们只保留了唯一的一个变化因素\(v_{2x}'\)。基于此,我们猜测对于任何物体,当它具有速度\(v\)时,它的质量\(m_v\)和它的静质量\(m_0\)之间满足关系:

\[m_v=\dfrac{m_0}{\sqrt{1-v^2/c^2}} \]

我们代入这个表达式,容易检验\(S'\)\(z'\)方向上是否有动量守恒:只需验证当\(m_1'=\dfrac{m_0}{\sqrt{1-(v_1')^2/c^2}}\)\(m_2'=\dfrac{m_0}{\sqrt{1-(v_2')^2/c^2}}\)时,成立\(\dfrac{m_{1}'}{m_2'}=\dfrac{1-u^2/c^2}{1+u^2/c^2}\)。计算可得确实成立。这意味着,\(m_v=\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)就是运动中的物体的质量的正确表达式。从表达式的数学形式中还可以看出,物体的质量和其运动方向无关,只与其运动速度的大小有关。

由此可见,“动量”的正确定义为\(\vec p=m_v\vec v\),也即\(\vec p=\dfrac{m_0 \vec v}{\sqrt{1-v^2/c^2}}\)。这是一个关于\(v\)的单调函数,可以写出其反函数\(\vec v=\dfrac{\vec p}{\sqrt{m_0^2+p^2/c^2}}\)。可以看到,\(p\to \infty\)\(v\to c\),可见当动量不断增大直至无穷时,速度也不会超过光速。这是相对论带给我们的重要结论:任何物体的速度都不能超过光速!这与经典力学是不同的。受恒力的物体的动量会不断增加,因为经典力学中质量是定值,所以这意味着物体的速度可以无穷大。但在相对论中,当动量增大到足够大以后,速度就几乎不再增加,动量的增加都由质量的增加来承担,具体地有\(m_v=\sqrt{m_0^2+p^2/c^2}\)

相对论下的能量

\(\newcommand{\d}{\text{ d}}\)现在来考虑一个完全非弹性碰撞的例子。假设两个静质量为\(m_0\)的相同物体以速度\(w\)相撞然后粘在一起静止。设粘在一起后变成一个静质量为\(M_0\)的物体。在经典力学中,我们认为:质量是守恒的,因此\(M_0=2m_0\);两个物体碰撞前总动能为\(2\cdot \dfrac{1}{2}m_0 w^2\),碰撞后动能全都转化为了“内能”,也即转化为了物体内部分子的运动,碰撞后的物体虽然静止但是温度升高了。但是在相对论中,运动中的物体能量为\(m_w\),而不是\(m_0\)。那么,相对论中的“守恒”应该是\(M_0=2m_0\),还是\(M_0=2m_w\),还是某种更复杂的情况?我们来尝试计算。

设上述完全非弹性碰撞过程在参考系\(S\)下沿着\(x\)轴进行,碰撞发生在\(0\)时刻。因为两粒子是关于\(z\)轴对称的,我们只分析半侧的运动过程。那么事件集为\(\{(wt,0,0,t)\mid t\leq 0\}\cup \{(0,0,0,t)\mid t\geq 0\}\)。现在我们用一个称为“虚速度法”的巧妙技巧来计算\(M_0\)\(m_0\)的关系。假设参考系\(S'\)\(0\)时刻与\(S\)重合,沿着\(S\)\(z\)轴(不是\(x\)轴!)的正方向以速度\(u\)运动。那么经过洛伦兹变换得到\(S'\)下的事件集为\(\{(wt,0,\dfrac{-ut}{\sqrt{1-u^2/c^2}},\dfrac{t}{\sqrt{1-u^2/c^2}})\mid t\leq 0\}\cup \{(0,0,\dfrac{-ut}{\sqrt{1-u^2/c^2}},\dfrac{t}{\sqrt{1-u^2/c^2}})\mid t\leq 0\}\)。可见,粒子碰撞前在\(S'\)坐标系下有\(x\)方向的速度\(v'_x=\dfrac{w}{\sqrt{1-u^2/c^2}}\),有\(z\)方向的速度\(v_z'=-u\),合速度\(v'=\dfrac{\sqrt{w^2(1-u^2/c^2)+u^2}}{1-u^2/c^2}\)。碰撞后\(x\)方向速度变为\(0\)\(z\)方向速度依然为\(v_z'=-u\),合速度为\(u\)。根据\(S'\)\(z\)方向的动量守恒,有\(2m_{v'}u=M_{u}u\)。因此\(2m_{v'}=M_u\)。现在,令\(u\to 0\),由洛必达法则可得\(v'\to w\),由复合函数的极限法则得\(2m_w=M_0\)。而\(m_w>m_0\),因此\(2m_0<M_0\)

上面的计算得出了一个非常反直觉的结论。当我们把两个静质量为\(m_0\)物体粘在一起时,粘在一起的那个物体的静质量要比\(2m_0\)更大,并且粘在一起的这个物体的静质量取决于我们用“多大的力气”把它们粘在一起(如果以极小的速度碰撞,那么碰撞后的静质量几乎不增加;如果以接近光速碰撞,那么静质量趋向无穷大)。粘合而成的物体不能看作原先那两个物体静止地摆放在一起,它已经是一个不同的物体了!在相对论中,守恒的量是\(2m_w=M_0\),这意味着新的物体把原先的物体因为运动而产生的那部分质量吸纳了进来,成为了自身的一部分静质量。模糊地说,运动的物体的“动能”进入了粘合之后的物体,这部分能量像经典力学中的内能一样,“储存”在\(M_0\)当中。究竟如何精确定义相对论下的能量?

在经典力学中,关于“能量”的讨论源于我们在动力学过程中,发现了一个数学上的守恒量。“能量”这一概念的提出,从本质上仅仅是为了方便我们计算和理解动力学现象。在经典力学中,根据力在空间上的积分我们得出了这样一个简洁的结果:设质量为\(m_0\)的质点在某时刻\(t\)所受的合力的大小\(\vec F\),速度为\(\vec v\),并在\(\vec F\)的作用下通过一小段距离微元\(\d \vec s\)。由牛顿第二定律可知\(\vec F=m_0\dfrac{\d \vec v}{\d t}\)。等式两边同时乘以\(\d \vec s\),有\(\vec F \d \vec s=m_0\dfrac{\d \vec v}{\d t} \d \vec s\)。由于\(\dfrac{\d \vec s}{\d t}=\vec v\),所以\(\vec F \d \vec s = m_0 \vec v \d \vec v=\d (\dfrac{1}{2}m_0 \|\vec v\|^2)\)。由此可见,如果力\(F\)做的功\(\Delta W\)使得物体的速度从\(v_1\)增加到\(v_2\),那么就有等量关系\(\Delta W=\dfrac{1}{2}m_0v_2^2-\dfrac{1}{2}m_0v_1^2\)。于是我们把这个关于速度平方的物理量\(\dfrac{1}{2}m_0v^2\)称为物体的动能,物体在某一过程中的动能的变化等于该过程中物体所受的外力沿物体运动的累加。

在经典力学中,动能可以用来表征物体运动的快慢。但我们已经看到,相对论中质量也可以表征物体运动的快慢。我们并不打算修改“做功”在相对论下的定义,依然把它定义为力在空间上的累加。这样,当外力做功时,物体的质量和速度同时增加。牛顿第二定律也需要被修正,我们不能再把\(m\)当作一个常数提取出来,它也是关于时间变化的量。新的牛顿第二定律是\(\vec F = \dfrac{\d (m\vec v)}{\d t}\),而不是\(\vec F = \dfrac{m\d \vec v}{\d t}\)。于是,设静质量为\(m_0\)的质点在某时刻\(t\)所受的合力的大小\(\vec F\),速度为\(\vec v\),并在\(\vec F\)的作用下通过一小段距离微元\(\d \vec s\)。在\(\vec F=\dfrac{\d\left(m_v\vec v\right)}{\d t}\)等式两边同时乘以\(\d \vec s\),有\(\vec F \d \vec s=\vec v \d(m_v \vec v)\)。现在,由分部积分法,\(\vec v\d\left(m_v\vec v\right)=\d(m_v v^2)-\dfrac{m_0\vec v}{\sqrt{1-v^2/c^2}}\d \vec v\),其中\(\dfrac{\vec v}{\sqrt{1-v^2/c^2}}\d \vec v=\dfrac{\d (v^2)}{2\sqrt{1-v^2/c^2}}=-\d\left(c^2\sqrt{1-v^2/c^2}\right)\)。由此可见,如果力\(F\)做的功\(\Delta W\)使得物体的速度从\(v_1\)增加到\(v_2\),那么就有等量关系\(\Delta W=m_{v_2}v_2^2-m_{v_1}v_1^2+m_0c^2(\sqrt{1-v_2^2/c^2}-\sqrt{1-v_1^2/c^2})\)。其中,\(m_vv^2+m_0c^2\sqrt{1-v^2/c^2}=\dfrac{m_0v^2+m_0c^2(1-v^2/c^2)}{\sqrt{1-v^2/c^2}}\)\(=\dfrac{m_0c^2}{\sqrt{1-v^2/c^2}}=m_vc^2\)。这就对应经典力学中的“动能”。所以在相对论下,\(\Delta W=m_{v_2}c^2-m_{v_1}c^2\)。所以我们不妨就把\(E_K=m_v c^2\)称为相对论下物体的动能。

特别地,如果\(v=0\),那么物体在相对论下的动能为\(m_0c^2\),而不是\(0\)。不过,这只是能量原点的问题,我们并不关心能量原点是否为0,因为关于能量,重要的只是能量的“变化”。对于这个结果,可以这样说:任何物体仅仅因为其存在就有一部分能量\(m_0c^2\),把这部分能量可以称为“静能”;而当物体接受外力做功时,其动能的增加量满足\(\Delta E=\Delta m \cdot c^2\)。把质点静止时的能量定在\(m_0c^2\)处而不是\(0\)有一个非常方便的地方,那就是质点的能量直接正比于其质量,只相差一个常数\(c^2\)

回到完全非弹性碰撞的例子, 由于已知\(2m_w=M_0\),所以这意味着\(2m_wc^2=M_0c^2\)。这意味着, 相对论下的完全非弹性碰撞居然是动能守恒的!从数学上,碰撞后粘在一起的物体并没有显示出类似“内能”的这样一个附加项,\(M_0c^2\)就已经是其全部能量,这部分能量仅仅来自于这个物体的存在。

对此,爱因斯坦提出一个全新的想法。他认为在相对论下,我们不必区分物体的总能量由这部分动能、这部分势能、这部分内能等等分割开来,而是简单地说:相对论下质量为\(m\)的物体的能量为\(E=mc^2\)。所有物体的能量总和是守恒的,这等价于所有物体的(相对论)质量总和是守恒的。事实上,随着物理学的发展,物体的内部结构很多时候是无法看清楚的,但是“抛开内部结构,总是认为系统的能量总和就是其质量乘以光速的平方”这样的做法却一次又一次被实验证实(其中最有名的,就是在原子弹爆炸时,人们测出裂变损失的质量\(\Delta m\)恰好与爆炸损释放出的总能量\(\Delta E\)满足\(\Delta E = \Delta m c^2\)的关系)。从这个角度看,质量只是能量的一种表现形式,爱因斯坦称之为“质能相当性”。或许,经典力学中引入的“质量”这一概念并不是理解宇宙的最直接的方式。能量不只是一种数学上的简便计算,它可能是一种更本质的存在。

最后,我们指出物体的速度\(v\)、动量\(p\)、总能量\(E\)能以一个相当简单的方式联系起来。对\(m=\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)两边同时平方得到\(m^2(1-v^2/c^2)=m_0^2\),于是\(m^2c^4-m^2v^2c^2=m_0^2c^4\)。于是得到

\[E^2-p^2c^2=m_0^2c^4 \]

还有一个关系也很常用,在\(E=mc^2\)两边同时乘以\(v\)得到

\[Ev=pc^2 \]

对光子来说,根据量子力学中的\(E=h\nu,p=h/\lambda\),得到\(E=pc\)。所以\(E^2=p^2c^2\)。而\(E^2-p^2c^2=m_0^2c^4\),所以\(m_0=0\)。这意味着光子的静止质量为0。但我们不能代入\(E=\dfrac{m_0c^2}{\sqrt{1-v^2/c^2}}\)说光子的能量也为0,因为光子的速度始终为\(c\),这是个\(0/0\)的未定式。光子确实具有能量\(E=h\nu\),这个能量是由它永远以光速运动才具有的能量。

时空

我们将会看到,相对论下的时间和空间其实是同一个更本质物理对象的投影。正如闵可夫斯基所说,“空间本身和时间本身将消失在完全的阴影之中,只有它们之间的某种结合才将得以生存。”

时间与空间的四维矢量

在洛伦兹变换中,\(\gamma=\dfrac{1}{\sqrt{1-\beta^2}}\),这是洛伦兹因子。如果令\(\beta=\dfrac{u}{c}\),表示相对速度与光速的比值,同时把\(ct\)看作一个整体,会得到一个非常简洁的形式:

\[\begin{aligned} x'&=\gamma(x-\beta \cdot (c t))\\ y'&=y\\ z'&=z\\ ct'&=\gamma \left(ct-\beta\cdot x \right) \end{aligned} \]

用矩阵表示:

\[\begin{bmatrix}x'\\y'\\z'\\ct'\end{bmatrix}=\begin{bmatrix}\gamma & 0 & 0 & -\gamma\beta\\ 0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ -\gamma\beta & 0& 0& \gamma\end{bmatrix}\begin{bmatrix}x\\y\\z\\ct\end{bmatrix} \]

注意到这样一件事:对于任何四维矢量\((x,y,z,ct)\),上面这个线性变换不会改变\(x^2+y^2+z^2-(ct)^2\)的值。计算一下就可以验证:\((x')^2+(y')^2+(z')^2-(ct')^2\)\(=\gamma^2(x-\beta\cdot (ct))^2+y^2+z^2-\gamma^2(ct-\beta x)^2\)\(=(x^2-c^2t^2)(\gamma^2-\gamma^2\beta^2)\)\(+y^2+z^2\)\(=x^2+y^2+z^2-(ct)^2\)。可见,如果把\(x^2+y^2+z^2-c^2t^2\)理解为“模长”,那么洛伦兹变换就是保长度的线性变换。不仅如此,这一形式还和矢量的“转动”非常相似。例如,二维矢量\((x,y)\)在平面上逆时针转过\(\theta\)角得到矢量\((x',y')\)时,满足坐标变换\(x'=x\cos\theta+y\sin\theta,y'=y\cos\theta-x\sin\theta\)。可见洛伦兹变换中时间和空间的混合,就好像是在四维空间里“视角”的一次转动而已。我们把这个四维空间称为“时空(spacetime)”。

如何理解这样一个四维空间呢?我们可以这样类比:当我们观察一个三维空间中的立方体时,假设观察始终正对着立方体的一个面并且只能前后移动,那么观察者的移动只会导致其观察到的立方体各个顶点坐标中的两个维度发生变化,无法观察到第三维度的变化;但假设它可以在三维空间中的任何位置观察,那么当他移动时就会观察到第三维度的变化,当观察者每转过一个角度,立方体的各个顶点坐标会同时以一种“混合”的方式发生变化。洛伦兹变化也是这样,由于日常经验不足以让我们接触到高速,因此我们平常的观察视角都局限于空间这三个维度上,注意不到第四个维度的变化,所以我们得出了伽利略变换作为我们的法则。现在,关于光的研究让我们的视角在整个四维空间中转动,所以我们注意到了时间与空间的混合。所以,在新的视角下,“四维空间”是一种更正确的理解世界的方式,每个物体都占有三个维度的空间,还有一个维度的时间。这个新的世界就是“时空”。

我们很容易接受,三个空间维度是互相平等的。但是当我们在理解第四个维度的时候,因为我们用了不同的单位,它看上去总好像是与空间维度不平等的。这种不平等就好像在三维空间中用“米”来衡量\(x,y\)的维度,却用“英尺”来衡量\(z\)的维度一样。因此,为了把单位统一起来,我们令\(1\text{ m}=c\text{ s}\),把时间的标准单位定位“米”,那么洛伦兹变换可以写成更简单的形式。原本的\(x'=\dfrac{x-ut}{\sqrt{1-u^2/c^2}}\)中的\(t\)的单位是秒,一秒等于\(1/c\)米,因此\(t\)要用\(t/c\)来代换;同时,速度\(u\)的单位是\(\text{m/s}\),所以\(u\)要代换成\(uc\)。光速是常数\(1\)。由此得到的新的变换是:

\[\begin{aligned} x'&=\dfrac{x-ut}{\sqrt{1-u^2}}\\ y'&=y\\ z'&=z\\ t'&=\dfrac{t-ux}{\sqrt{1-u^2}} \end{aligned} \]

时空间隔

在新的单位制下,对于两个时空点\((x_1,y_1,z_1,t_1)\)\((x_2,y_2,z_2,t_2)\),我们把\((t_1-t_2)^2-(x_1-x_2)^2-(y_1-y_2)^2-(z_1-z_2)^2\)这个量称为两个时空点之间的“时空间隔(spacetime interval)”,它在洛伦兹变化下也是不变的。(之所以取了负号,是为了之后表示的方便)

验算:

\((x_1'-x_2')^2-(t_1'-t_2')^2\)
\(=\left(\dfrac{x_1-ut_1}{\sqrt{1-u^2}}-\dfrac{x_2-ut_2}{\sqrt{1-u^2}}\right)^2-\left(\dfrac{t_1-ux_1}{\sqrt{1-u^2}}-\dfrac{t_2-ux_2}{\sqrt{1-u^2}}\right)^2\)\(=\dfrac{(1+u)((x_1-x_2)-(t_1-t_2))(1-u)((x_1-x_2)+(t_1-t_2))}{1-u^2}\)\(=(x_1-x_2)^2-(t_1-t_2)^2\)

可见,时空间隔就好像传统三维空间中的“距离”一样,是不随观测点的改变而改变的客观物理量。

光锥

注意到,时空间隔的表达式不具有平方和的非负性,因为出现了负号。所以,我们不能全盘类比三维空间中“距离”的概念。我们还需更深入地理解这个表达式的含义。

假如一束光发射的事件为\((x_0,y_0,z_0,t_0)\),那么假设这束光到达事件\((x,y,z,t)\),那么可以计算得到光走过的距离平方为\((t-t_0)^2\)(因为新的单位制下光速为\(1\)),因此\((x-x_0)^2+(y-y_0)^2+(z-z_0)^2-(t-t_0)^2=0\)。所以,同一束光所到达的各个时空点之间的时空间隔为\(0\)。而任何事物的速度都不能超过光速,所以任意物体的运动所经过的两个时空点\((x_0,y_0,z_0,t_0)\)\((x,y,z,t)\)满足\((x-x_0)^2+(y-y_0)^2+(z-z_0)^2\leq (t-t_0)^2\),也即时空间隔为正。正的时空间隔和我们经验中的“间隔”比较像,我们称它为“类空间隔(spacelike interval)”;如果时空间隔为负,我们称它为“类时间隔(timelike interval)”,任何物体都不能经过一个类时间隔到达另一个时空点。

对于任意一个给定的时空点\((x_0,y_0,z_0,t_0)\),把时空中全体与它时空间隔为\(0\)的时空点集合(曲面)称为由\((x_0,y_0,z_0,t_0)\)形成的光锥(light cone),\((x_0,y_0,z_0,t_0)\)称为光锥原点。我们把光锥想象成一个四维空间里的“圆锥”。光锥上的点恰好是光锥远点出发的光所能到达的时空点,在光锥“内部”,负的时间轴的那半部分与原点的间隔是类空间隔,这些事件可以影响到原点,这部分区域是“可感知的过去”;光锥内部正的时间轴的那半部分与原点的间隔也是类空间隔,原点可以影响到这部分区域,是“有影响的未来”。而光锥之外的部分与原点的间隔为类时间隔,它既不能影响到原点,我们也不能以原点来影响它。例如,太阳的爆炸只能影响到八分钟以后的地球,八分钟以内的地球处于“太阳爆炸”的光锥之外,不可能受到爆炸的影响。

动量与能量的四维矢量

四维矢量\((x,y,z,ct)\)的时空间隔在洛伦兹变换下的不变性,不应该只被看作数学上的一个结果。这种不变性暗示我们有一个“更根本的存在”。举例来说,经典力学中,三维空间中的人注意到“距离”这个三维矢量的三个分量的平方之和在任何旋转、平移的坐标变换下都保持不变,所以“距离”是一种比“距离分量”更根本的存在。那么,我们也应该认为,四维矢量\((x,y,z,ct)\)是比时间、空间更根本的存在。为了进一步佐证这一观念,我们将展示:物体的动量的三个分量和能量组成的四维矢量\((p_x,p_y,p_z,E)\),也是这样一种更根本的存在!

为了对称性,我们已经把时间和空间的单位统一了。在这样的单位制下,光速是常数\(1\)。于是,根据原先的\(E=mc^2\),能量和质量的单位也是统一的,所以有\(E=m\)。这样,原先的关系式\(E^2-p^2c^2=m_0^2c^4\)就告诉我们

\[E^2-p^2=m_0 ^2 \]

其中,\(E^2-p^2\)的形式恰好就是时空间隔的定义中“四维矢量的模长”的构成形式\(E^2-p_x^2-p_y^2-p_z^2\)(这种统一性难道不暗示着那个更根本的存在吗?)。静质量并不会因为坐标系的变换而改变,所以\(E^2-p^2\)也是在洛伦兹变换下保持不变的。鉴于我们并没有证明国静质量在洛伦兹变换下保持不变,我们下面通过计算验证\(E^2-p^2\)的不变性:

设物体的静质量为\(m_0\),在\(S\)坐标系下的\(x\)方向上有速度\(v\)。现在设\(S'\)相对\(S\)\(x\)方向的速度\(u\),根据速度的变换公式有\(v'=\dfrac{v-u}{1-uv}\)。因此\(E'=\dfrac{m_0}{\sqrt{1-v'^2}}=\dfrac{(m_0/\sqrt{1-v^2})-(m_0v/\sqrt{1-v^2})u}{\sqrt{1-u^2}}=\dfrac{m-muv}{\sqrt{1-u^2}}=\dfrac{E-up_x}{\sqrt{1-u^2}}\)。而\(p'=m_{v'}v'=E'v'=\dfrac{m(1-uv)}{\sqrt{1-u^2}}\cdot \dfrac{v-u}{1-uv}=\dfrac{p_x-uE}{\sqrt{1-u^2}}\)。这恰好给出了四维矢量\((p_x,p_y,p_z,E)\)的洛伦兹变换,它在形式上与时空的变换完全相同:

\[\begin{aligned} p_x'&=\dfrac{p_x-uE}{\sqrt{1-u^2}}\\ p_y'&=p_y\\ p_z'&=p_z\\ E'&=\dfrac{E-up_x}{\sqrt{1-u^2}} \end{aligned} \]

我们把这个四维矢量也称为“动量”,它的时间分量就是能量。这样,在相对论中当我们说“动量守恒”时,它不仅代表了三个维度空间下的动量守恒,还包含了能量守恒。动量的“模长”就是静质量。

在看到了这种统一性以后,我们甚至可以发展出一套这样的四维空间下的几何学或代数学。四维矢量的长度定义为\(t^2-x^2-y^2-z^2\),而长度是矢量与自身的点积,由此把四维矢量\((x_1,y_1,z_1,t_1),(x_2,y_2,z_2,t_2)\)的点积定义为\(t_1t_2-x_1x_2-y_1y_2-z_1z_2\),等等。

参考文献

[1] A. Einstein On the Electrodynamics of Moving Bodies
[2] R. Feynman The Feynman Lectures on Physics, Vol. I
[3] A.P. French The Special Theory of Relativity
[4] R.Shankar Open Yale Courses: Fundamentals of Physics

posted @ 2025-08-02 08:38  行而上  阅读(135)  评论(0)    收藏  举报