规范场是电,弱,强相互作用的基本数学理论,规范场理论是二十世纪下半叶物理学最辉煌的成就之一,也是现代物理学最重要的概念之一。规范场的建立与一系列著名的物理学家的名字联系在一起,包括外尔(Hermann Weyl),杨振宁和米尔斯(Mills)等,我们在这里从最早被发现的一种规范场———— 电磁场开始介绍,去回顾科学史上那些一念非凡的头脑和激动人心的岁月。
规范场的历史回顾
Beauty is truth.美既是真。——Hermann Weyl 1885-1955
我们知道爱因斯坦建立广义相对论的最重要的思想就是对称性(广义协变性原理),使得对称性这一思想在爱因斯坦之后开始引起物理学界的广泛重视。广义相对论和麦克斯韦方程组分别为引力场和电磁场建立了物理原理与数学方程,成为二十世纪上半叶科学家最为熟悉的两种基本相互作用。
广义相对论诞生之初的1918年,德国数学家赫尔曼·外尔(Hermann Weyl,1885-1955)就在爱因斯坦的启发下试图从对称性的思想入手,探索电磁场方程所具有的对称性,外尔建立了一种叫做“Eich Invarianz” 的对称变换,从数学上来看这种理论相当优美,可惜很快爱因斯坦指出其没有物理意义。外尔后来遗憾地说“Was wahr ist, ist schoen”(美即是真)。事实上,外尔的理论已经相当接近现代规范场理论,这也使得他成为规范场理论的先驱。
在本系列之前的关于广义相对论的介绍中我们已经知道,由广义协变性(对称性)直接便得到了爱因斯坦的场方程,这便暗示那个时代的物理学家,对称性可以是建立物理定律(物理方程)非常关键的指导思想。在爱因斯坦之前,对称性与物理定律的密切关系没有引起重视,在广义相对论诞生之后,外尔首先意识到了电磁场的麦克斯韦方程也应当像爱因斯坦场方程一样,对应于一种基本的对称性,这种对称性就是我们所要介绍的规范不变性。不变性,协变性都是对称性。
广义协变性(对称性)——》 爱因斯坦场方程
规范不变性(对称性) ——》 麦克斯韦方程
1929年,外尔在量子力学理论的启发下,开始重新探索电磁场方程所具有的对称性,于是发现了电磁场就是一种规范场——U(1)规范场,它所具有的对称性就是规范不变性,规范场理论就此诞生。也是受外尔的启发,杨振宁和Mills 在1954 年为非阿贝尔(非交换)规范场建立了研究方法,他们为SU(2)规范场建立了理论框架,为相互作用理论的进一步发展奠定了基础。
小插曲——外尔和规范场
外尔是一个科学思想非常超前的物理学家和数学家,除了规范场理论,外尔早在1929年就已经从理论上发现了弱相互作用的宇称不守恒,但这一思想在那个时代过于超前而被放弃并遗忘。直到1957 年,杨振宁和李政道因发现弱相互作用的宇称不守恒而获得诺贝尔奖,此时外尔的思想才重新受到人们的重视。
此外,二十世纪下半叶很多获得诺贝尔奖的重要工作都直接或间接受益于外尔早年的远见卓识,例如下文的内容所涉及的,从外尔开始物理学家才开始真正重视对称性及作用量的概念。外尔在数学界的影响力远远大于物理学界,因其为数学家的身份他的很多物理思想没有得到及时的重视,尽管外尔的一些工作具有其时代的局限性,但就如外尔自己所言“美既是真”,他的科学思想是科学永恒的魁宝。
值得一提的是,早在杨振宁之前,O.B.Klein(1894-1977, 瑞典物理学家)也曾独立建立过非阿贝尔规范场理论,可惜他的工作因二战爆发没有引起应有的重视[6]。我们之后开始简单介绍电磁场方程所对应的规范场理论,这是一种最早被发现也是一种最简单的规范场理论。首先我们需要简单回顾一下狭义相对论、闵可夫斯基空间与洛伦茨向量场。
闵可夫斯基空间与四维向量场
狭义相对论是爱因斯坦在1905年为电磁场建立的对称性理论,它的物理原理只有一个,就是光速不变性原理(真空中光速的测量与它的参考系无关,一般的教材里介绍的“狭义协变性原理”与它等价),狭义相对论是电,弱,强相互作用所遵守的基本物理原理,我们在这里需要使用的是狭义相对论的几何结构——闵可夫斯基空间。
狭义相对论的所有物理结论都可以用闵可夫斯基空间及其向量场来表述,这也是我们需要熟悉的。闵可夫斯基空间是一种平直的四维空间(1维时间+3维空间,但这和四维欧式空间不同)M^4,记c为光速。
读者可以将其视为一个4维的平面。它的度量为(度量的不同是它和四维欧式空间的唯一区别——小编注),
因为这个空间是4维的,所以在这个空间上定义的向量场都是四维的,一般记为
, 其下角标, 我们也称其为“四维向量潮,或者规范常 所有的规范场都是这种四维向量场,
包括电磁场的电磁势 Aμ , 弱相互作用的三个规范场
, 强相互作用的8个规范场
,这些都是四维向量常四维向量场由闵可夫空间的四维坐标系来表示,
由四维向量场表述的物理定律应当在坐标系的变换下保持不变,
这种坐标系的变换被称作洛伦茨变换,由此得到的协变性被称作洛伦茨协变性,
也叫洛伦茨对称性。
闵可夫斯基空间的坐标变换如下所示(被称为洛伦茨变换)
其中β=v/c 。用四维向量场表示的物理定律必须在上述坐标变换下形式不变,例如麦克斯韦方程:
方程组变换前后形式保持不变
事实上规范场都是这样的四维向量场。
电磁场的规范变换
我们把一个动量为
Pμ的电子放在一个电磁势
为Aμ(还是四维向量场)的电磁场中,它的动量就会变为
。不过需要注意的是,由于电子具有量子效应,这里的“动量”不是一个物理量,
而是一个算符(这是量子物理和经典物理一个本质区别)。
在量子力学中,动量对应于导数算符,即
, 记
其中Dμ就是电子在电磁场中的导数算符,自然地便有 , 即 ,Dμ就是我们在规范场 中使用的求导算符,在数学上 Dμ被称作协变导数。
在量子理论中,电子的运动行为用波函数来刻画,表示电子的概率幅(可以理解为某种“振幅”。量子力学的一大基本假设就是把电子看作波,所以才有了波函数的定义——小编注)。它的绝对值的平方是电子在时空中某一点出现的概率,而将几率幅乘上一个相因子,意味着概率幅的相位变化了一个角度θ(x),对计算该粒子的概率丝毫没有影响(也可以理解为把波函数做了一个平移,使对应波的“相”发生改变——小编注)。所以我们要求物理定律(也就是对应的数学方程)在波函数的这种变换(旋转)下应保持不变,于是Aμ也必须同时发生相应的变换(旋转)。我们把这两个变换合在一起称之为电磁场的规范变换(因为旋转可以由一维酉群U(1)描述,也称之为U(1)规范变换):
由于波函数是函数,电磁势是四维向量(场),所以它们发生规范变换(旋转)的方式不同
也许读者们会感到奇怪:波函数只是乘了一个“相因子”而已,
Aμ为什么就变得那么恣意妄为了呢?其根本原因在于,由于波函数是函数,电磁势是四维向量场,所以它们发生规范变换的方式不同。更确切地讲,Aμ的变化需要保证如下等式成立:
这个等式确保了方程的形式保持不变
我们再举一个例子以加强读者们对规范场变换的理解。在电磁场中刻画电子运动的是狄拉克 方程(也就是考虑了电子自旋,以及狭义相对论效应的薛定谔方程):
当波函数发生变换
时,规范场Aμ的变换
保证了狄拉克方程的形式保持不变:
这种方程形式的不变性在数学上被称为“协变性”,也可以叫做“对称性”。在上述规范变换中θ如果是一个常数,即
,那么 Aμ就不发生变换,这种规范成被称为整体规范场。如果
,规范场即被称作局域规范场。
从第一个图我们看到规范场
Aμ 是定义在时空每一个点上的四维向量场,这种结构在数学上被称为“向量丛”(有的著作中称之为“纤维丛”,)。第二个图给出了电子的波函数在每一点上的相位变换
,第三个图则看出了在波函数的相位变换下,规范场Aμ 也发生规范变换。
小插曲——规范变换的命名上面的变换为什么会被命名为“规范变换”呢?早在1919年,外尔构造的变换是规范变换的雏形,当时他的变换不含虚数单位i,使得变换纯粹成为了尺度的变换,外尔也称这个变换的不变性为Eich Invarianz(德文,意思是“尺度规范不变性”)。尽管后来外尔的变换被认为没有物理意义,但却极大地启发了正确的规范场理论的建立,英文中就一直沿用外尔命名的“gauge invariance”,意思是规范不变性。
值得一提的是,上述规范变换也引起了数学家巨大的兴趣,并直接启发了二十世纪下半叶微分几何理论的发展,著名华人数学家陈省身早在规范场理论诞生之初便在与杨振宁的交流中发现规范场是一种微分几何的“联络”,并展开了相关研究。
规范场是一种数学上的联络,这种联络被总结为“线性复丛联络”。联络是一种数学概念,是由于几何空间的弯曲导致的弯曲效应,在广义相对论中,四维时空的弯曲导致的联络在数学上被称为Levi-Civita联络,规范场则是向量丛几何结构的弯曲导致的联络,规范场的几何结构已经成为现代数学的重要研究领域。数学家西蒙·唐纳森(Simon Donaldson) 在1983 年就以Yang-Mills规范理论为框架研究了四维流形的微分结构,成为现代几何学发展的重大突破。
西蒙·唐纳森,他证明了一些4维流形(注意规范场就是4维的)上纤维丛(规范变换+规范场)的某种二次型(可看作矩阵)可对角化,从而引导出一系列针对4维流形的有趣结论。这一结果使他获得1986年菲尔兹奖
物理系统的对称性与作用量
我们在这里再次回到外尔关于规范对称性的思想, 对称性可以确定作用量的形式。
“作用量”又是什么呢?其实在数学家看来,它就是泛函(Functional,函数概念的推广,它的自变量和因变量可以不仅是实数,还可以是任何函数——小编注)的一种。我们如上已经讨论了电磁相互作用有两种对称性:洛伦茨对称性与规范对称性。通过这两种对称性我们可以直接确定出电磁相互作用的作用量 Lqed,
Aμ和电子的波函数映射到实数(函数->实数),形式为
其中,上述映射 Lqed将Aμ和映射称为实数,所以是一个“泛函”,物理上叫做作用量。
上述作用量的形式是如何确定的呢?就是电磁场所具有的两种对称性,即洛伦茨对称性与规范对称性。上述形式的作用量在洛伦茨变换与规范变换下均保持不变(且是保持在这两种变换下不变的最简单的数学形式)。作用量是现代物理学中最重要的概念,基本相互作用,量子场论,统计物理凝聚态等物理研究方向都需要计算它们的作用量。作用量Lqed的一个重要的作用是计算得到物理定律所对应的微分方程,比如说,通过上述作用量 即可计算得到如下两个电磁场的基本微分方程(通过对作用量计算变分方程即可得到):
两大方程分别对应洛伦茨对称性和规范对称性
我们所介绍的这两种对称性:洛伦茨对称性和规范对称性,作用量 和上述两个方程构成了量子电动力学(Quantum Electrodynamics)的基本内容,上述所得到的方程也具有规范对称性。
具体得到上述物理方程的方法就是变分法,有兴趣的读者可以查阅任意经典力学教材
其中M是u的时空定义域,D_u 是关于u的导数,则对于运动系统u所满足的方程就是
。这一步是求变分方程,是数学的方法,通过这种方法便计算出了这个物理系统的运动方程。值得一提的是,通过拉格朗日动力学原理可以推导出狄拉克方程。
以电磁场作为例子,状态函数就是
Aμ,作用量就是Lqed ,物理方程就是上述狄拉克方程与麦克斯韦方程。再以引力场为例,引力场的状态函数就是黎曼度量 gμv,作用量就是爱因斯坦-希尔伯特作用量Leh ,物理方程就是爱因斯坦场方程。
关于对称性的思想小结如下:
1.首先我们需要确定用来刻画物理系统的状态函数。例如电磁场的Aμ ;
2.然后用物理系统具有的对称性确定该系统作用量的形式。例如在电磁场中,根据 U(1)对称性确定了作用量Lqed的形式;
3.由作用量的形式确定物理定律的数学方程。例如根据作用量 Lqed的形式通过求变分方程得到了电子运动的 狄拉克方程与麦克斯韦方程,这些是电磁场的基本方程。
总结
实际上,上一节中提到的思想不仅对电磁场和引力场有效,还适用于几乎所有的物理系统。引力,电磁,强,弱相互作用,统计物理,宇宙学等研究领域都可以由上述思想展开研究,只是不同的物理系统所具有的对称性不一样,它们所对应的作用量形式就不一样,不同系统对应的物理原理不一样,根据作用量得到物理方程的方式就有所差异。