为什么广义相对论是不可重整化的？（转自：知乎）

楼上已经有人提到，power counting是不可重整的原因，这当然是正确的答案，但却不是完整的答案。简单说，power counting的基本思路依旧是原始朴素的重整化思想：引入抵消项消除极高能过程导致的无穷大（紫外发散），并保证计算所得的物理参数（如物理质量、物理电荷）与真实测量得到的参数相同。我们发现只有当相互作用的耦合常数（如电荷）有着负幂次的质量量纲时，理论高能细节导致的无穷大才能被抵消，而引力场作为一个自相互作用系统，其耦合常数却有着正幂次的质量量纲。总之，power counting告诉我们引力场理论没法通过有限的抵消过程凑出答案，但这是为什么呢？

在这里，我们需要适当跟随K. G. Wilson和其他场论大家的步伐，从更加深刻的角度审视重整化。

假设我们有一个万有理论，包含全部可能的物理，我们能用它来做什么呢？理论上说，我们可以用它计算世间一切可能的物理过程，大到宇宙诞生、星系演化，小到粒子生灭、晶格振荡。只要我们有一台足够强大的计算机，我们就可以计算寰宇之内的所有可能性。然而当我们足以计算万物的时候，一个哲学问题就出现了：计算出结果，是否等于理解了结果？如果你去问一个理智的现代物理学家，得到的答案十有八九是否定的。时至今日，我们离真正的终极理论依旧相距遥远，但我们确实已经拥有足以计算地球、乃至太阳系范围内所有物理过程的理论，那就是广义相对论和粒子物理标准模型。如果我们降低一点自己的期望，把时间退回到60年前，量子力学的非相对论性薛定谔方程也已经蕴含了从晶体结构、化学反应到生命繁衍乃至社会演变的全部信息。但那时的物理学家却无法理解超导现象，也不清楚怎么用简单的Hubbard模型解释静电相互作用对金属导电性的压制，更不用说蛋白质的输运、耗散结构的建立，甚至物种和社会的演化。困难是显而易见的：1mol物质中就包含10^23个粒子，他们之间全都存在复杂的相互作用，有人估计出恒河沙数约为10^18，甚至都比不上这些粒子的数量。我们如何能为10万恒河之沙数的微观粒子，编写同台舞蹈的脚本？

K. G. Wilson给了我们一个出人意料的简单答案。这个答案的核心在于，如果我们关注的是一块面包的口感，我们为什么要费心思索基本粒子的性质呢？同样的逻辑也适用于物理学研究。当流体力学家研究流体的运动时，他可能直接从Navier-Stokes方程出发，而不会费心描述流体中分子的细微运动。Navier-Stokes方程所描述的物理当然蕴藏在分子集体运动的微观图像之中，但它剔除了微观级分子运动中我们并不关心的复杂细节，在简化理论描述的同时完全满足了我们的智力需求。这样一种刨除了无关的微观涨落，仅仅在一定的尺度层次上描述现象的理论，被称为一个有效理论(effective theory)。

在某种意义上说，我们知道的所有理论都是有效理论，描述超导的BCS理论并不关心高能下量子电动力学的散射过程，描述Mott绝缘体的Hubbard模型也并未引入夸克与胶子的复杂相互作用。尽管粒子物理标准模型能以无可比拟的精度预言电子和光子的相互作用，但我们依旧认为一个存在更加完备的“万有理论”（比如可能是M理论），它比起标准模型来，不晓得高到哪里去。K. G. Wilson给出了隐藏高能细节的系统方案，粗略地说，Wilson将高能量子场和低能量子场人为地分离开，并先行计算高能量子场对理论的全部影响，这种做法可以帮助我们把低能物理过程和低能观测量捉对隔离出来，进而得到完整的低能有效理论。物理学家们发现，高能过程的贡献，在低能物理环境下显得就像新的相互作用类型。这些由高能物理过程伪装而成相互作用，一部分可以重整化，另一部分不能重整化，如果我们不断降低所关注的能量标度（或者说，降低我们观测物理过程的精度），那么每一种相互作用的表观耦合常数都会不断变化。如果把可重整化的相互作用称为A类，反之为B类，物理学家严格证明了当能量不断降低时，A类相互作用的耦合常数会最终趋于某个不变的常值，而B类的耦合常数则会趋于0（严格说，趋于“无关”），我们将这样的一个极限称为理论的红外不动点。而对于一个给定能标下的理论，红外不动点实际上代表了理论（具体来说是量子场论）的严格数学定义。

回到我们最初的问题，引力理论作为不可重整化的理论，究竟代表着什么？我们不妨假设，存在一个最终囊括全部物理的万有理论，而广义相对论自然是这一理论在低能量过程中的近似。当我们从这一理论出发，不断降低观测的能量标度时，我们眼中的宇宙会不断涌现出形色各异的相互作用，而这些相互作用的耦合常数（包括电荷、色荷，甚至质量等）都会随着观测能量的降低而不断改变，这体现出高能物理过程不断以重新定义（renormalize）低能物理常数的方式体现自身的存在。与此同时，高能过程产生的不可重整相互作用，则随着能量降低而越来越微弱，直至最后完全无法被探测到。对量子电动力学来说，不可重整相互作用最终消失，而我们还剩下可重整的相互作用（红外不动点），这些相互作用恰好解释了我们在现有观测水平下可以探知的全部“高能”物理现象。而对引力理论来说，高能过程仅仅产生了广义相对论中的不可重整项，而当我们执意不断降低观测能量时，不可重整项完全消失，可重整项则根本不存在，留给我们的仅仅是空无一物的平直时空。

总而言之，高能物理过程在低能观测中的体现，可以归结为物理参数的重定义，以及不可重整相互作用的产生。前者仅仅是不痛不痒地改变了我们观测到的物理量，并不会产生新的物理，因而我们可以用“凑答案”的方式把它的影响吸收进抵消项里；而后者则彻底改变了物理过程的性质，我们如果想要理解这一理论，只有试图真正理解高能下的物理过程。这样的不可重整现象并不限于广义相对论，比如最早的弱相互作用理论是不可重整的四费米子相互作用理论，这一理论的不可重整性，暗示着更高能标下的弱电统一理论。可以说，不可重整性意味着我们必须直面高能下的新奇物理。

编辑于 2017-11-07

Assaf Shomer的这篇文章一直放在抽屉里没时间看，感谢@Yui Yoshioka的邀请，使得我得以把这篇文章翻出来认真看了一遍，对原先停留在power counting上的理解还是有所提升的。由于办公室的电脑没有中文输入法（并且也没有超级用户权限安装，这一段是在google在线输入工具下写的），所以等晚上(柏林时间)回到宿舍再写完整答案。决定科普下这篇文章。

我将分以下四个部分介绍：

1，什么是量子场论？

2，什么是重整化？

3，重整化群

4，为什么引力不可重整化？

一、什么是量子场论？

顾名思义，量子场论就是量子力学与场论的结合。场论我们都很熟悉了，比如温度场，静电场，磁场，引力场等等。它们通常可以用一个空间上的函数来描述，即，指定空间上的每一点，都赋予一个数值。比如说，你可以用温度计在你房间里的每一个角落测量温度，然后你就得到一个温度场了 $T(x)$ ，这里 $x$ 代表你房间里的空间位置。实际上，除了空间分布，我们还对场随时间变化的关系感兴趣，所以通常来说物理学家所说的场是 $T(x,t)$ ，也就说，多了一个时间变量。我们研究一个场就是要在已知一个初值条件下，求出这个场之后随时间空间的一个分布情况。经典情况下（物理学家说的经典其实就是指宏观世界），这个场的演化是唯一的，就是说，连接初态和末态的中间场位形是唯一的，我们可以把它称为经典轨道。而量子力学则是描述微观世界的物理理论，它的基本特征是量子涨落。所谓量子涨落是针对前面所说的经典轨道而言的，在微观情况下，实际上场的演化并没有唯一的轨道。在一个初态和末态之间，存在很多个可能的轨道，它们以一种概率振幅的方式叠加起来（注释1）。举个例子，考虑你房间里的均匀的温度场，如果没有热源，也不能散热，那么经典地，你能预测你房间里的温度将一直维持不变。但是在量子情况下，它不是这样的，它可能是 $T_1(x,t)$ , $T_2(x,t)$ 等等，实际上你有无穷多个可能性。你能做的是研究一个指定的初态到指定的末态发生的概率，你需要把连接这个初态与末态中间所有的可能轨道按照一定的概率幅叠加起来。你可能会说，实际生活中我并没有感受到那么多不同可能性的温度场啊。这里有两个原因，一是量子涨落只有在微观的尺度才能显现出来，二是我们的温度场本身不是一个基本场，它是分子原子的平均动能的宏观体现，当你把尺度缩小，小到分子原子尺度之下，那么分子原子的平均动能就没有意义了。我们举温度场的例子是因为我们对这个场概念熟悉。

电磁场是一个微观的量子场，光子则是电磁场的激发。除电磁场，我们还有电子场（一种叫旋量场的东西），电子则是电子场的激发。等等。有了这些量子场，要定义一个量子场论，还要给定一些参数。比如我们考虑由电子场、光子场以及它们相互作用的体系，我们还需要给定电子的质量 $m$ ，电子的电荷绝对值 $e$ ，我们把这些给定的参数统称为耦合常数。这样我们就定义了量子电动力学（QED)。

二、什么是重整化？

好了，我们有了那些量子场，那么我们可以干嘛呢，自然是计算一些物理可观测量了。比如我们研究一个特定状态的电子和一个特定状态的光子”碰撞”（散射）之后产生另一种特定状态的电子和光子的概率。当然，物理可观测量远不止这些散射概率。还记得我们前面说过的量子涨落吗？这些量子涨落实际上是会修正耦合常数的。我们因此可以计算这些修正 $\delta m$ ， $\delta e$ 。现在问题来了！我们之前说过，那些涨落实际上有无穷多，而无穷多的涨落引起的高阶修正是无穷大！一个无穷大的量没有意义。为了搞清楚那些无穷大怎么来的，我们可以先对那些量子涨落进行限制，即所谓的截断。比如我们先假定在高于某个能标 $\Lambda$ 下涨落就不存在了。这样，我们得到的表达式就是 $\delta m=\delta m_1+\delta m_2(\Lambda)$ ，这里 $\delta m_1$ 是一个不依赖 $\Lambda$ 的有限值，而 $\delta m_2(\Lambda)$ 是一个依赖于 $\Lambda$ 且随 $\Lambda$ 趋于无穷而趋于无穷。通过这种方式，我们发现发散来源于 $\delta m_2(\Lambda)$ 。于是我们有

$\tilde{m}=m+\delta m_1+\delta m_2(\Lambda)$ ，

$\tilde{m}$ 是量子修正之后的物理量。显然 $\tilde{m}$ 随着 $\Lambda$ 趋于无穷而趋于无穷，也就是说量子修正后的物理量是无穷大。似乎我们精心设计的量子场论是错的。问题是，它还有得救吗？有！我们来想想我们所给定的 $m$ 是什么？它是观测量吗？不，它不是，我们测量到的电子实际上是已经经过量子修正的，也就是 $\tilde{m}$ 。而我们测量到的值显然是一个有限值。那么问题出在那儿，问题就是我们之前认为 $\tilde{m}$ 是无穷大默认了一个假设，那就是这个非观测量 $m$ 是一个有限值。如果，它作为一个观测不到的东西是依赖于 $\Lambda$ 且随 $\Lambda$ 趋于无穷而趋于无穷呢？这样我们就有

$\tilde{m}=m_1+\delta m_1+m_2(\Lambda)+\delta m_2(\Lambda)$ ，

我们也从 $m$ 中分离出了一个有限项 $m_1$ 和一个依赖于 $\Lambda$ 的项 $m_2(\Lambda)$ 。由于 $m$ 实际上是一个人为的东西（artifact），我们可以让 $m_2(\Lambda)+\delta m_2(\Lambda)=0$ 从而消掉了发散项，得到一个有限的值。聪明的读者一眼就看出了问题，那就是在上述过程中，从一个无穷大量分离一个有限量加一个无穷大量的方式是任意的。除了要求 $m_2(\Lambda)+\delta m_2(\Lambda)=0$ 之外，我们怎么确定剩下的 $\tilde{m}=m_1+\delta m_1$ ？答案当然是，让实验说话！这个值是一个实验输入值。这么看起来上述的过程并不像很多人说的那样不自然。我们把 $m$ 称为裸量，因为它是没有量子修正的，且实际上不是物理观测量。把量子修正分离成 $\delta m=\delta m_1+\delta m_2(\Lambda)$ 称之为正规化（正规化的方式并不唯一），把要求 $m_2(\Lambda)+\delta m_2(\Lambda)=0$ 这个操作称之为把无穷大吸收到裸量里面去。把条件 $m_1+\delta m_1=实验测量值$ 称为重整化条件。这整个过程就叫重整化！

三、重整化群

现在问题又来了！我们说了，我们需要通过实验本身决定重整化条件：

$m_1+\delta m_1=实验测量值$ 。

但是，实验测量值是一成不变的吗？幸运的是，实验测量值通常只依赖一个东西，那就是你测量这个物理量时所在的能标或者说尺度（能标越大，对应着尺度越小）。所以我们实际上有

$\tilde{m}(\Lambda_o)=实验测量值@能标\Lambda_o$ ，

下标o表示observable（观测量）。照这么说，我们岂不是到一个能标就测量一次，收集所有不同能标下的耦合常数，然后召唤神龙让那些理论家滚蛋了？No! 理论家的聪明超乎你想象！他们说，你只需要测量某一个能标下的耦合常数就可以了，然后作为理论的输入部分，他们就可以给你输出不同能标下的耦合常数，当然还包括其它物理量，比如我们之前说的散射振幅。养活他们，不会让你失望。

因此总的来说，我们发现，那些耦合常数并不是真的常数，而是随着能标的变动而跑动的。描述这个跑动过程，就称为重整化群。（我觉得理论家在取物理名词的时候真的很不聪明，耦合常数非常数，重整化群不是群）

四、为什么引力不可重整化？

当然，我们不会在这里给出重整化群方程。但是我们想骄傲地说：

“Imagination is more important than knowledge.”

错了，

我们考虑任意一个耦合常数 $\tilde{g}(\Lambda_o)$ 。为了研究这个 $\tilde{g}(\Lambda_o)$ 的表达式，我们先考虑两个非常接近的 $\tilde{g}(\Lambda_1)$ ， $\tilde{g}(\Lambda_2)$ 的比值关系。假设 $\tilde{g}$ 的量纲（即它与能标的单位上的关系）为r，那么我们自然会猜测如下关系

$\frac{\tilde{g}(\Lambda_1)}{\Lambda_1^{r}}=\frac{\tilde{g}(\Lambda_2)}{\Lambda_2^r}$ 。

但是这个关系是错的！

为了看出原因，我们需要更小心点。假设我们想从实验已经测量过的 $\tilde{g}(\Lambda_1=200GeV)$ 计算出 $\tilde{g}(\Lambda_2=201GeV)$ ，从能量200GeV到201GeV实际上是我们实验探针的缩小，从而探测更小的尺度，也就是更高的能标。我们有两种做法。一，假定存在一个基本截断能标（比如普朗克能标），老老实实地计算从这个基本截断能标到200GeV的量子涨落以及到201GeV的量子涨落，然后比较它们的差别，自然能根据相差的量子涨落得到 $\tilde{g}(\Lambda_2=201GeV)$ 了。二，还存在一个更简单的方法！为了明白这个方法，我们举个例子，假如我们有两把一长一短的尺子，测量一根棍子的长度，我们已经用长尺子量了知道这个棍子是30个长尺子的长度。现在我们想知道这个棍子是多少个短尺子的长度。除了用这个短尺子去测量之外，我们还可以让这个棍子做一个比例为长尺子/短尺子的拉长，我们仍然用长尺子去测量拉长后的棍子，测量到的次数就是原来那个棍子与短尺子的比值。看起来有点绕，但不管怎样，稍微想一下还是很清楚的。好了，我们现在想知道 $\tilde{g}(\Lambda_2=201GeV)$ 的值，与其让探针缩小，为何不把量子场的空间放大呢？为此，我们对全空间进行一个比例变换

$x\rightarrow (201/200)x$ , $E\rightarrow (200/201)E$ （1）

变换之后的耦合常数记为 $\bar{g}$ （头顶上的波浪线改成了横线）。在把空间拉大之后，我们不需要再重复把探针缩小了。我们只需要计算 $\bar{g}(200GeV)$ ，并且应该有 $\tilde{g}(\Lambda_2=201GeV)=\bar{g}(\Lambda_2=200GeV)$ 。现在我们考虑的是 $\tilde{g}(200GeV)$ 与 $\bar{g}(200GeV)$ 的关系，这时才真正能用耦合常数g在标度变换下的变换关系：

$\bar{g}(200GeV)=(\frac{200}{201})^r\tilde{g}(200GeV)$ 。

换到 $\tilde{g}(\Lambda_2=201GeV)$ ，就是

${\tilde{g}(\Lambda_2)}=(\frac{\Lambda_1}{\Lambda_2})^r\tilde{g}(\Lambda_1)$ 。

这是两个无穷靠近能标的耦合常数之间的关系，但是我们仍然把它应用到不是无穷靠近的两个耦合常数的关系（严格来说需要积分）。我们可以选一个能标较高的参考点 $\Lambda$ （这里代表较高能标的变量，不用与之前的截断能标建立联系），那么就有

${\tilde{g}(\Lambda_o)}=(\frac{\Lambda}{\Lambda_o})^r\tilde{g}(\Lambda)$ 。

我们看到如果g具有正质量量纲，那么在低能下它会越来越大，因此它被称为relevant的，而如果具有负质量量纲，那么它就会越来越小，因此它被称为irrelevant的。可重整化的理论定义为在所有能标底下都有意义的物理理论，特别地在所有能标 下耦合常数均为有限值。你可能会先担心具有正质量量纲的耦合常数，因为它看起来会在低能下发散。但实际上，正质量量纲的耦合常数并不需要担心，你只需要让 $\tilde{g}(\Lambda)$ 在 $\Lambda$ 趋无穷时趋于0（0也是有限值，是有意义的）就可以保证在低能下有一个有限的耦合常数（高能低能两端都有意义）。而对于负质量量纲的耦合常数就很危险了。如果我们在低能尺度上，观测到一个负质量量纲的耦合常数，那么意味随着能标上升，这个耦合常数（重整化之后的，不是裸量）是趋于无穷的，理论在极高能量下变得没有意义。这种情况下，通常意味着这个低能理论是一个只适用低能能标的有效理论，在更高能下，需要被其它更基本的理论替代。如果Fermi理论被电弱统一理论替代一样。试图把Fermi理论量子化并应用到所有能标下是一件很naive的行为。

由于引力耦合常数具有负质量量纲，而且是低能下观测到的，所以它就存在这个问题。广义相对论本身不可能在所有能标底下都意义。

实际上，我们并没有什么硬性的理由要求物理理论必须可重整的，就是说，我们并没有理由假想理论在所有能标下都有意义，也许就是存在基础能标截断呢，超过这个能标，物理定律不存在。就像凝聚态里面的晶格尺度就是一个真实存在的截断（而不是理论人为引入的），在凝聚态里面，超过晶格尺度下的场真的没有意义。

（关于Assaf Shomer提到的黑洞熵谱的argument，有时间以及知友有兴趣的话再更，可留言告知）

注释1：你可以把所有可能的轨道的整体看成一个量子轨道，而量子轨道的演化本身是确定的。意思是说，我们能精确且唯一地预测那些概率幅的叠加方式。

发表评论 取消回复

发表评论取消回复