年轻的麦克斯韦尔
十九世纪下半叶,麦克斯韦尔是“自牛顿以后世界上最伟大的数学物理学家”,但其电磁学理论一开始并没有得到承认。
1885年开始,赫兹的一系列实验证实了麦克斯韦的电磁学理论,并且证明了电磁波和光波的一致性。在麦克斯韦的电磁学方程组中,电磁波在真空中的速度是一个常数。这意味着,光波在真空中的传播速度也应当是一个常数。
伟大的实验物理学家赫兹
1887年,迈克尔逊-莫雷实验,一个设计得非常精巧的实验,通过干涉仪意在测出不同惯性系不同方向上光速有差值,最后却得出了相反的结果——光速在各向上似乎是同性的。我们如果把地球看作是一列大火车,结果光从车头射到车尾或者从车尾射到车头的速度是一样的,根本不用考虑火车本身的速度。
迈克尔逊莫雷实验的基本思路
这意味着光速在真空中的传播速度是恒定的、绝对的,不必考虑任何参考系的因素。这与牛顿力学是表面矛盾的。如果我们坐在一列火车上,以同等速度从车尾走到车头,或从车头走到车尾,以地面为静止参考系来测量,两者的速度是不一致的。然而光无视于如此,火车头向前射出的光与火车尾向后射出的光,不论从火车上测量还是从地面上测量,都将会得出同样的光速。
这是为什么呢?人们百思不得其解。开尔文勋爵说这是悬在物理学上空的两朵乌云之一。
在牛顿力学中,相对运动的两个惯性参考系(譬如前述地面参考系与火车参考系)之间的坐标变换服从所谓伽利略变换。
设相对静止参考系K系描述某一事件的四维时空坐标为(x,y,z,t),该事件在相对K系运动的参考系K'对应的四维时空坐标为(x',y',z,t')。为了简化描述,不妨设K'系在X轴正方向上相对K系匀速直线运动,速度为v。于是根据伽利略变换,有:
x'=x﹣vt y'=y z'=z t'=t
或者
x=x' vt' y=y' z=z' t=t'
也就是说K系坐标与K'系坐标在Y轴、Z轴及时间轴上相同,唯一不同的是X轴上的坐标,但两者的对应关系也可以建立起来。两者的差值是K系坐标原点与K'系坐标原点在X轴方向上的距离s,而s=vt。
通过伽利略变换,一个运动物体在K'系上的坐标可以变换为K系上的坐标,或者在K系上的坐标可以变换为K系上的坐标;在这变换过程中,K系与K'系所适用的数学原理与物理学原理没有什么不同。这也是为什么乘客在火车上的运动情况,从火车上测量,可以轻松地代换为相对某一地面参考系(譬如以火车站为坐标原点)的运动情况。
于是我们会知道一个人从车尾向车头前进,如果时速为3公里,火车时速为100公里,那么这个人相对地面时速为103公里。
这似乎是天经地义的。但代换为光波的运动却不行了。因为无论从理论到实验,都惊人一致地指向了真空中光速各向同性的光速不变原理。火车头发出的光束其速度无法再叠加火车本身的速度,火车尾向后发出的光束其速度无须再减去火车本身的速度。
这意味着光速不变原理与伽利略变换有矛盾。而伽利略变换是物理学的奠基性原理相对性原理的数学形式。我们很难想象,物理测量不建立参考系是有意义的。因此,显然,相对性原理绝对不应当被抛弃。
年轻时的爱因斯坦
怎么解决两者的矛盾呢?爱因斯坦认为应当抛弃绝对时空观,因为绝对不变的时空其实是不存在的,时空其实是可变的。
这意味着 x'=x﹣vt 这个公式或许应当添一个系数λ,而改为
x'=λ(x﹣vt) ①
由于不同参考系的物理学原理应当一致,x=x' vt'相应地也应当改为
x=λ(x'﹣vt') ②
λ这个系数或因子如果值为1,也即λ=1时,即所谓的伽利略变换。但是λ其实未必就天然应该等于1。也就是说运动参考系的时间度量与空间度量,未必就应当不变地等同于静止参考系。
如果系数λ的值不等于1,则意味着运动参考系的时空度量是会发生变化的,那么其具体的值应当如何求出呢?
这个系数必须使得不同参考系下的真空光速是不变的。
因此,我们考虑在K系与K'中分别测量同一个光子的运动,该光子在两个参考系之间的坐标之间的关系。
假设在初始时刻,K系与K'在X轴上的原点相同,此时一个光子从两个参考系的X轴原点处朝X轴正方向上射出,同一时间K'系以速度v朝X轴正方向相对K系运动。设该光子在K系的坐标为(X,Y,Z,T),相应地在K'系的坐标为(X',Y',Z',T')。又设光速为c。
于是在K系的时间点T时,该光子在K系上的横坐标为:
X=cT
在K'系与K系时间点T对应的时间点T'时,该光子在K'系上的横坐标为:
X'=cT'
又根据前述变换①与变换②,有:
X'=λ(X﹣vT) ③
以及
X=λ(X'+vT') ④
将③×④,则有
X'X=λ²(X﹣vT)(X'+vT') ⑤
将X=cT以及X'=cT'代入上式⑤,可以消去T及T',同时求出λ为:
λ=1/√1-v²/c²
这意味着①式与②式可以分别改写为
x'=(x﹣vt)/√1-v²/c²
与
x=(x' vt')/√1-v²/c²
由此还可以推导出:
t'=x'/c=(t﹣vx/c²)/√1-v²/c²
以及
t=x/c=(t﹢vx'/c²)/√1-v²/c²
这意味着代表着相对性原理的伽利略变换应当替换为下述洛伦兹变换:
或其逆形式
上述洛伦兹变换使得光速不变原理与相对性原理之间的矛盾消失了。
洛伦兹因子是相对运动参考系之间的时空度规的换算比率(狭义相对论只考虑了平直的空间距离与时间快慢,没有考虑曲率问题),这就像两种货币之间有“汇率”的变动。
牛顿力学的换算因子是常数1,用的是伽利略变换,这是隐性的假设空间尺度处处绝对一致,时间处处均匀流逝,所以是一种绝对时空观。而这其实是未经证明的。事实上只能是在参考系之间的相对运动为低速情况下近似正确。
理解洛伦兹变换是如何得来的之后,我们就不难理解其他推广应用。我们会知道光速在真空中恒定,而时间与空间是相对性的。我们也就不难理解运动参考系相对静止参考系的所谓动钟变慢与尺度收缩等相对论效应。
由此可见,掌握狭义相对论并不是特别难。
然而实际上,我看到许多教科书上,不管是西方的还是中国的,对狭义相对论的讲解并不是太对头的。他们讲的似乎还是停留在洛伦兹当初推出洛伦兹变换的思考方式,而不是真正的爱因斯坦物理意义上的相对论;这两者的差异其实是巨大的。所以,问题似乎也没那么简单。