张量退化的等价刻画
本文中, 我们讨论的张量是指有限维 \(K\)-向量空间的张量积, 其中 \(K\) 是代数闭的.
一个三阶张量也即 \(U\otimes V\otimes W\) 中的一个元素 \(T\). 我们称 \(T'\) 是 \(T\) 的一个 约束 (restriction), 当存在线性映射 \(A\colon U\to U', B\colon V\to V', C\colon W\to W'\) 使得 \(T' = (A\otimes B\otimes C)(T)\), 记为 \(T'\leq T\).
对于固定的张量空间 \(U'\otimes V'\otimes W'\), 我们考虑其中所有的张量 \(T'\leq T\) 构成的集合记为 \(R=\{T' : T' \leq T\}\). 如果 \(T'\in \overline{R}\), 这里的闭包是 Zariski 拓扑, 则称 \(T'\) 由 \(T\) 拓扑 退化 (degenerate) 得到 \(T'\trianglelefteq_{\mathrm{top}} T\).
另一种退化的经典定义则是用未定元来刻画: 如果存在 \(K[t]\)-线性变换 \(A,B,C\) 其中 \(A\colon U\otimes_K K[t] \to U'\otimes_K K[t]\), 对 \(B,C\) 的定义类似. 读者可想象为把 \(K\)-矩阵改为 \(K[t]\)-矩阵, 这时 \(T'\) 是 \(T\) 的一个退化, 当 \((A\otimes B\otimes C)(T)\) 的关于 \(t\) 的最低次项非零系数为 \(T'\), 记为 \(T'\trianglelefteq T\).
Strassen 证明了上述两个刻画等价, 他是使用几何不变量 (Geometric Invariant Theory) 理论的基本结论直接得到的. 在 Bürgisser, Clausen 和 Shokrollahi 的代数复杂性教科书中整理了一个仅使用交换代数的证明.
上学期正好复习了一下交换代数, 我们接下来看看很多交换代数中的概念和基本定理, 在这样具体的问题中是如何发挥作用的.
证明
引理 1. 设 \(X\) 是一个维度 \(n\geq 1\) 的仿射 (不可约) 代数簇, 其中 \(U\subseteq X\) 是一个非空开子集. 对于 \(x\in X\), 存在一条不可约曲线 \(C\subseteq X\) 使得 \(x\) 经过 \(C\) 且 \(C\) 与 \(U\) 相交.
证明. 第一步, 我们将一个一般的空间 \(X\) 转换到简单的空间上. 为此我们可以使用 Noether 正规化引理:
Noether 正规化引理 (Noether Normalization Lemma). 若 \(A\) 是有限生成的 \(k\)-代数, 则存在超越无关元 \(y_1,\dots,y_m \in A\) 使得 \(k[y_1,\dots,y_m]\subseteq A\) 是整扩张, 也即 \(A\) 是 \(k[y_1,\dots,y_m]\) 的有限生成模.
我们考虑 \(X\) 所在的某个仿射空间 \(K^N\) 中, 其坐标环自然是有限生成 \(K\)-代数. 那么根据 Noether 正规化引理, 存在超越无关元 \(y_1,\dots,y_m\in K[X]\) 使得 \(K[y_1,\dots,y_m]\subseteq K[X]\) 是整扩张. 进一步地, 每一个坐标 \(x_i\) (\(1\leq i\leq N\)) 都满足 \(\overline{x_i}\) 在 \(K[y_1,\dots,y_m]\) 上整的, 因此固定一组坐标 \((y_1,\dots,y_m) \in K\), 在 \(X\) 中满足的点只有有限个 (因为每个 \(x_i\) 必然是代数方程的解).
将嵌入 \(K[y_1,\dots,y_m] \subseteq K[X]\) 看做环同态, 其还原出的态射就告诉我们 Noether 正规化引理的一个常用推论:
存在有限满态射 \(\pi\colon X \to K^m\). (有限意即每个点的原像都有限)
显然 Noether 正规化引理给出的 \(m\) 应当等于 \(X\) 的维数 \(n\).
在 \(K^m\) 这种简单的空间中, 选取曲线是极为容易的. 我们考虑 \(\pi(X\setminus U)\), 因为 \(X\setminus U\) 的维数低于 \(n\), 所以一定存在 \(y'\) 使得 \(y' \notin \pi(X\setminus U)\), 而且 \(y' \neq \pi(x)\). 然后我们直接把 \(\pi(x)\) 和 \(y'\) 取连线, 这条直线 \(C'\) 就在 \(K^n\) 上满足要求.
现在我们需要将 \(C'\) 提升到 \(X\) 上. 由于 \(\pi(x)\) 有可能有多个原像, 我们显然还需要注意如何保证 \(x \in C\).
现在我们来看代数-几何对应关系: 我们所处的周围空间是 \(X\) 和 \(K^n\) 这两个簇, 它们有对应的坐标环:
对应地, 几何对象 \(C'\) 是 \(K[y_1,\dots,y_n]\) 中的一个素理想 \(\mathfrak p'\). 我们想找到的曲线 \(C\) 是 \(K[X]\) 中的一个素理想 \(\mathfrak p\), 它应该满足 \(\mathfrak p' = \mathfrak p^c\).
然而我们还需满足 \(x\in C\) 的条件. 设 \(\mathfrak m'\) 是 \(\pi(x)\) 在 \(K[y_1,\dots,y_n]\) 中的极大理想, 且 \(\mathfrak m\) 是 \(x\) 在 \(K[X]\) 中的极大理想. 根据 \(\pi(x) \in C'\) 我们有 \(\mathfrak p' \subseteq \mathfrak m'\), 我们欲求的 \(\mathfrak p\) 应当满足 \(\mathfrak p \subseteq \mathfrak m\).
整理一下, 我们可以得到如下的图示, 告诉我们素理想 \(\mathfrak p\) 要求的条件:
这正是 Cohen–Seidenberg 定理所保证的:
Cohen–Seidenberg 定理 的下行 (going down) 部分: 若 \(A\subset B\) 是整闭整环的整扩张, 那么满足下行性质:
对于 \(A\) 中的素理想降链 \(\mathfrak q' \supset \mathfrak p'\) 以及 \(B\) 中的素理想 \(\mathfrak q\) 满足 \(\mathfrak q^c = \mathfrak q'\),
存在 \(B\) 中的素理想 \(\mathfrak p\) 使得 \(\mathfrak p' = \mathfrak p^c\) 且 \(\mathfrak q \supset \mathfrak p\). 也即补全如下图表\[\begin{array}{cccc} A & \mathfrak q' & \supset & \mathfrak p' \\ & | & & | \\ B & \mathfrak q & \supset & \color{grey} \mathfrak p \end{array} \]
最后让我们确实验证一下 \(\pi(C) = C'\).
首先对于任意 \(z'\in C'\), 对应有极大理想 \(\mathfrak m'_{z'} \supset \mathfrak p'\). 此时考虑 Cohen–Seidenberg 定理的上行 (going up) 部分:
Cohen–Seidenberg 定理 的上行部分: 若 \(A\subset B\) 是整扩张, 那么满足上行性质: 总能补全如下图表
\[\begin{array}{cccc} A & \mathfrak q' & \supset & \mathfrak p' \\ & | & & | \\ B & \color{grey} \mathfrak q & \supset & \mathfrak p \end{array} \]
在上面的问题中, 也即找到 \(z\in \pi^{-1}(z')\) 使得 \(z\in C\). 这就说明了 \(C' \subset \pi(C)\). 另一个方向的包含是简单的.
最后, 注意我们选取的 \(y'\) 满足了 \(y'\) 的任何一个原像都在 \(U\) 里, 所以 \(C\) 一定经过 \(U\). \(\square\)
引理 2. 对于代数簇 \(X, Y\) 以及态射 \(\varphi\colon X\to Y\). 对于 \(y \in \overline{\varphi(X)} \setminus \varphi(X)\), 存在不可约曲线 \(X_1\subset X\) 和 \(Y_1\subset Y\) 使得 \(\overline{\varphi(X_1)} = Y_1\) 且 \(y\in Y_1\).
证明. 首先不妨把 \(X\) 限制在像的闭包包含了 \(y\) 的那个连通分支里. 现在 \(X\) 是不可约的, 所以 \(\varphi(X)\) 及其闭包也不可约. 根据 Chevalley 定理, 可以选取一个在 \(\overline{\varphi(X)}\) 里的开集 \(U \subset \varphi(X)\). 应用引理 1, 我们可以得到 \(\overline{\varphi(X)}\) 中的一个不可约曲线 \(Y_1\) 使得 \(y\in Y_1\) 且 \(Y_1\) 和 \(U\) 相交.
现在再把 \(Y_1\) 拉回到 \(X\) 上, 我们得到了一个更大的空间 \(\varphi^{-1}(Y_1)\), 其中总存在一个分支 \(X'\) 不会映到 \(Y_1\) 的某单个点上. 在随便选取一点 \(y'\in \varphi(X')\), 根据引理 1, 存在不可约曲线 \(X_1\subset \varphi^{-1}(Y_1)\) 使得 \(\varphi(X_1)\) 经过至少 \(Y_1\) 中的两点, 这说明 \(\overline{\varphi(X_1)} = Y_1\). \(\square\)
引理 3. 对于代数簇 \(X, Y\) 以及态射 \(\varphi\colon X\to Y\). 对于 \(y \in \overline{\varphi(X)}\), 存在 \(K\)-同态 \(\psi \colon K[X] \to K((t))\) 使得复合 \(\psi \circ \varphi^*\) 后的像在 \(K[[t]]\) 里, 且常数项是 \(e_y\), 其中 \(e_y\colon K[Y]\to K\) 是在 \(y\) 点的求值映射 \(e_y(f) = f(y)\).
证明. 如果 \(y\) 本来就在像中, 那常值映射足够. 否则根据引理 2, 可以不妨设 \(X, Y\) 均是不可约曲线, 且 \(\overline{\varphi(X)}=Y\).
我们再看代数-几何对应, 在几何上看, 要求的同态相当于某种经过 \(X\) 的解析曲线, 但复合 \(\varphi\) 之后在 \(t=0\) 处穿过 \(y\).
作为一个初学者, 在这里我一开始产生了一个疑问: 能不能直接搞一条有理曲线呢? 答案是不行, 因为有理曲线对应一个同态 \(K[X] \to K(t)\), 但这进一步可以提升得到函数域的嵌入 \(K(X) \subset K(t)\). 根据 Lüroth 定理, 说明 \(K(X)\) 本身就是一个有理函数域. 但这一般来说是不对的, 这当且仅当 \(K(X)\) 是一条有理曲线, 而诸如椭圆曲线就不可能满足这个条件.
为了找到这个 \(\psi\), 我们首先要做这样一步操作: 支配映射 \(X\to Y\) 诱导了嵌入 \(K[Y] \subseteq K[X]\), 这进一步使得我们可以将 \(K[Y]\) 放在分式域 \(K(X)\) 中. 现在我们取 \(K[Y]\) 在 \(K(X)\) 中的整闭包, 记为 \(B\).
根据代数几何对应, 由于 \(B\) 的分式域也是 \(K(X)\), 它对应的几何对象 \(\tilde Y\) 是和 \(X\) 双有理等价的. 但另一方面, 作为整闭包, Cohen–Seidenberg 定理保证了诱导的映射 \(\tilde Y \to Y\) 是满射. 我们可以直接找到在 \(\tilde Y\) 上的曲线使得在 \(t=0\) 处经过 \(y\), 然后再把这个有理映射经过 \(\tilde Y\) 和 \(X\) 的双有理等价得到 \(X\) 上的情况.
现在我们看看如何用代数的语言写下来: 根据 Cohen–Seidenberg 定理, \(K[Y]\) 里的极大理想 \(\mathfrak m_y\) 必然可以写作 \(B\) 里的某个极大理想 \(\mathfrak m'\) 拉回来的形式. 而 \(B\) 的分式域是 \(K(X)\), 所以 \(B\) 是整闭的. 此时 \(B\) 是 Dedekind 整环, 它在任何一个极大理想处的局部化都是离散赋值环. 我们取在 \(\mathfrak m'\) 处的局部化, 记为 \(\mathcal O\). 进一步, 我们将 \(\mathcal O\) 完备化, 记为 \(\widehat{\mathcal O}\).
Cohen 结构定理 (Cohen Structure Theorem). 如果 \(A\) 是包含某个域 \(k\) 的 \(n\) 维完备正则局部环, 那么 \(A\) 同构于 \(n\) 元形式幂级数环 \(k[[x_1,\dots,x_n]]\).
因此, 我们有
其中 \(t\) 可以取为 \(\mathcal{O}\) 中的单值化子 (uniformizer) 的像.
那么取 \(t=0\) 这个操作其实就是商掉 \((t)\), 我们有 \(K[[t]]/((t)) \cong B/\mathfrak m' = K\), 这也说明了此时取 \(t=0\) 得到的这个 \(B\to K\) 的映射是在 \(\mathfrak m'\) 处的求值映射.
那么如果再复合上 \(K[Y]\subset B\) 的话, 因为 \(\mathfrak m'^c = \mathfrak m_y\), 此时得到的 \(K[Y]\to K\) 这个映射就是在 \(y\) 点的求值映射 \(e_y\).
接下来, 因为 \(B \to K[[t]]\) 实际上是嵌入, 我们可以再把这个映射分式化为 \(\operatorname{Frac}(B) \to K((t))\). (为什么 \(B\) 的分式域是 \(K(X)\)? 这也是一道常规的交换代数习题.) 再根据 \(K(X) = \operatorname{Frac}(B)\), 我们经过限制就得到了所需的同态 \(\psi\colon K[X] \to K((t))\).
最后我们确定曲线情况确实可以划归到一般情况. 设 \(X_1\subset X, Y_1\subset Y\) 是满足条件的曲线, 我们有了一个 \(\psi\colon K[X_1] \to K((t))\) 使得 \(\psi \circ (\varphi|_{X_1\to Y_1})^*\) 的像在 \(K[[t]]\) 中, 且常数项是 \(e_y\). 根据嵌入 \(X_1 \subset X\), 有同态 \(K[X]\to K[X_1]\), 链接得到提升 \(\tilde \psi\colon K[X] \to K((t))\). 根据交换图表
可知 \(\tilde \psi \circ \varphi^*\) 的像仍然在 \(K[[t]]\) 中, 且常数项仍然是 \(e_y\). 这就完成了证明.
\(\square\)
定理 (Strassen, 1987). \(T'\trianglelefteq_{\mathrm{top}} T\) 当且仅当 \(T'\trianglelefteq T\).
证明. 固定 \(T\). 我们取陪域为 \(X = \operatorname{Hom}(U,U')\times \operatorname{Hom}(V,V')\times \operatorname{Hom}(W,W')\), 值域为 \(U'\otimes V'\otimes W'\), 映射为 \(\varphi(A,B,C)=(A\otimes B\otimes C)(T)\).
应用引理 3, 对于 \(T'\trianglelefteq_{\mathrm{top}} T\), 也即 \(T'\in \overline{\varphi(X)}\), 存在 \(K\)-同态 \(\psi\colon K[X] \to K((t))\) 使得 \(\psi \circ \varphi^*\) 的像在 \(K[[t]]\) 中, 且常数项是 \(e_{T'}\). 取对偶, 相当于是说存在
使得 \(\varphi(A,B,C) = T' + O(t)\). 那么将 \(A,B,C\) 做适当截断, 再通分, 就可以得到
使得 \(\varphi(A,B,C) = t^hT' + O(t^{h+1})\), 也即 \(T'\trianglelefteq T\).
另一个方向的证明简单, 留作读者自行验证. \(\square\)
一些注记
上面这个证明是高度一般的, 我们可以将很多代数计算模型考虑它的 Zariski 闭包. 比如说对张量而言, 取 \(T\) 为对角矩阵, 约束就给出张量的秩, 而退化给出张量的边界秩 (border rank). 一般而言, 一个多项式有可能可以被一个电路 \(C\) 计算, 但放宽条件, 如果这个电路任意填系数得到的多项式系数构成的空间取闭包, 可以得到的多项式就被这个电路 "边界计算" 出. (好吧我暂时没研究怎么更好地翻译这个词). 这样可以定义出来多项式大小的电路 \(\mathbf{VP}\) 和他们能计算的电路构成的极限 \(\overline{\mathbf{VP}}\).
看起来边界计算是一个 "并不现实" 的概念. 但复杂性理论依然要关心它. 为什么呢? 因为目前很多证明代数复杂性下界的手段都来源于某种多项式检测. 也即:
- 找到某个多项式 \(P\), 使得低复杂度的多项式电路的系数在 \(P\) 上为零.
- 证明我们关心的那个多项式 \(f\) 在 \(P\) 上非零.
这样就能证明 \(f\) 是一个高复杂度的多项式. 但注意: 这个方法似乎告诉了我们一个更强的事实: 因为所有低复杂度的多项式的闭包也必然包含在 \(P\) 的闭包中. 有没有一种可能, 我们那些关心的难以计算的多项式, 恰好 能够在简单的多项式的闭包之中? 这个问题可以大概描述为:
从尝试证明 \(=\) 的角度, 这个问题称为去边界化 (deborder) 问题. 上面 Strassen 刻画可以看做是第一步: 如果一个多项式在极限里, 那么它实际上可以将所有系数加上一个未定元的多项式, 然后被最低次项计算出. 如果我们能把最低次项 \(t^h\) 给出一个很强的上界, 就说明可以直接模拟这个多项式的计算. 直接研究 \(\mathbf{VP}\) 太困难, 大家目前都在研究一些非常简单的计算模型, 也即各种秩 (对应于某种低层电路).
Lehmkuhl 和 Lickteig (1989) 证明了, 对于三阶张量的秩而言, 近似次数 \(h\) 有上界
其中 \(h\) 是 \(n\times m\times l\) 的张量 \(T\), 边界秩不超过 \(r\).
Dutta, Gesmundo, Ikenmeyer, Jindal 和 Lysikov (2024) 对 Waring 秩证明了一个强很多的结果: 一个齐次 \(d\) 次多项式 \(f\) 的 Waring 秩 \(\operatorname{WR}\) 是最小的 \(r\) 使得 \(f\) 可以写作 \(r\) 个线性型的 \(d\) 次方和. 他们证明了
其中 \(r\) 是边界 Waring 秩, \(d\) 是多项式的次数. Shpilka (2025) 进一步改进到了 \(d\cdot r^{O(\sqrt r)}\).
另一个角度是, 在某些度量下, 边界化没有给予我们更强的计算能力 (虽然能帮我们进行构造). 例如三阶张量的渐进秩和渐进边界秩是等价的, 也即 \(\omega\) 也可以用边界秩来定义.
去边界化到底能做到什么程度, 这个问题还十分未知.

浙公网安备 33010602011771号