两个对数凸不等式
\(\newcommand{\LE}{\operatorname{LE}}\newcommand{\sfT}{\mathsf{T}}\)
Alexandrov-Fenchel 与 Stanley
我们考虑一个大小为 \(n\) 的偏序集 \(P\) 以及其上有一个偏序关系 \(\leq\). 记 \(\LE(P)\) 是 \(P\) 的全体 线性扩张 (linear extension), 是所有的保序双射 \(\sigma \colon P \to [n]\), 也即, 对于任何 \(x \leq y\) 都有 \(\sigma(x) \leq \sigma(y)\).
现在, 对于一个元素 \(x\), 考察所有的线性扩张 \(\sigma\in \LE(P)\) 中, 有多少个 \(\sigma\) 使得 \(\sigma(x) = k\). 这个数量记作 \(N_k(x)\).
Chung, Fishburn 和 Graham 猜测, 对于任意的 \(x\), 数列 \(N_k(x)\) 是对数凸的. 也即, 对于任意的 \(k\), 有 \(N_{k-1}(x)N_{k+1}(x) \leq N_{k}(x)^2\). 这个猜想被 R. P. Stanley 证明了, 现在一般称为 Stanley 不等式.
Stanley 的考虑办法是将偏序集的线性扩张给予另一种几何刻画. 对于偏序集 \(P\), 考虑它的序多胞体 \(O_P\) 是 \(\mathbb R^P\) 中的一个凸多胞体:
让我们找出这个多胞体如何提供了 \(N_k(x)\) 这样的信息. 我们对这个多胞体首先进行基本的分析, 首先的一个观察是 \(O_P\) 的体积等于 \(\# \LE(P) / n!\), 这是因为 \(O_P\) 可以进行如下的单形剖分: 对于每一个线性扩张 \(\sigma\), 不妨写作 \(\sigma(x_i) = i\), 那么 \(\sigma\) 对应的单形是
这样的单形的体积是 \(1/n!\), 而 \(O_P\) 是所有这样的单形的 (内部无交) 并集.
接下来让我们进一步考虑 \(N_k(x)\) 藏在哪里. 考虑 \(O_P\) 在 \(f(x) = \lambda\) 这个截面, 对于每个单形 \(O_\sigma\), 如果 \(x = x_k\), 那么 \(O_\sigma\) 在这个截面上就形如
这个 \(n-1\) 维多胞体是一个 \(k-1\) 维单形和一个 \(n-k\) 维单形的直积. 从而, 我们有
把所有的 \(O_\sigma\) 的贡献加起来, 我们得到了 \(O_P\) 在 \(f(x) = \lambda\) 这个截面上的体积:
接下来, 我们需要从另一个角度刻画 \(O_P\) 这个多胞体.
对于一个多胞体, 一个几何直觉上显然的事实是, 多胞体是它的所有顶点张成的凸包. 而顶点是将定义多胞体中的一些不等式变成等式的点. 对于 \(O_P\), 我们容易证明如下事实:
定理. \(O_P\) 的顶点恰是所有保序映射 \(\{0, 1\}^P\). 也即那些 \(f \in \{0, 1\}^P\), 使得任何 \(x\leq y\) 都有 \(f(x) \leq f(y)\).
现在, 让我们从另一个角度考察 \(O_P\) 在 \(f(x)=\lambda\) 的截面. 首先我们把 \(O_P\) 的顶点根据 \(f(x)=0\) 和 \(f(x)=1\) 分成 \(V_0, V_1\) 两组. 记这两组顶点张成的凸包分别是 \(O_0, O_1\). 那么由于 \(O_P\) 就是 \(O_0, O_1\) 张成的凸包, 而且 \(O_0, O_1\) 刚好是两个截面, 我们有
这里的加法是 Minkowski 和.
最后, 轮到我们的主角登场了. 凸几何中有如下的一个重要对象: 对于 \(n\) 维凸体 (紧凸集) \(K_1, \ldots, K_n\), 存在唯一的函数 \(\operatorname{V}(K_1,\dots,K_n)\) 满足如下性质:
- \(\operatorname{V}(K_1,\dots,K_n)\) 是个 \(n\) 元对称函数, 也即交换 \(K_i\) 的顺序不改变 \(\operatorname{V}\).
- 对于任何 \(m\) 个凸体 \(K_1, \ldots, K_m\) 和非负实数 \(\lambda_1, \ldots, \lambda_m\), 有
这个函数称作凸体的 混合体积 (mixed volume). 进一步的, Alexandrov 和 Fenchel 证明了如下的一个关于混合体积的不等式:
Alexandrov-Fenchel 不等式.
对于凸体 \(A, B\) 和 \(n-2\) 个凸体 \(K_1, \ldots, K_{n-2}\), 有\[\operatorname{V}(A,B,K_1,\dots,K_{n-2})^2 \geq \operatorname{V}(A,A,K_1,\dots,K_{n-2}) \operatorname{V}(B,B,K_1,\dots,K_{n-2}). \]
最后, 让我们证明 Stanley 不等式.
Stanley 不等式. 对于任意的 \(x\), 有 \(N_{k-1}(x)N_{k+1}(x) \leq N_{k}(x)^2\).
证明. 我们比较 \(O_P\) 在 \(f(x)=\lambda\) 的截面上的体积的两个公式, 一个是
另一个是将混合体积的定义代入 \(|(1-\lambda) O_0 + \lambda O_1|\), 得到
其中 \(O_1[k-1]\) 是指重复放入 \(O_1\) \(k-1\) 次.
比较两个公式, 我们得到
将 \(A = O_1, B = O_0\) 代入 Alexandrov-Fenchel 不等式, 我们得到
这样, 我们证明了 Stanley 不等式. \(\square\)
Lorentz 多项式与 Mason
固定一个大小为 \(n\) 的拟阵 \((E, \mathcal I)\), 我们记 \(k\) 元独立集的个数为 \(I_k\). Mason 猜想是如下不同强度的不等式:
- (对数凸) 对于任意的 \(k\), 有 \(I_{k-1}I_{k+1} \leq I_k^2\).
- 对于任意的 \(k\), 有 \((1 + \frac 1 k) I_{k-1}I_{k+1} \leq I_k^2\).
- (超对数凸) 对于任意的 \(k\), 有 \((1 + \frac 1 k) (1 + \frac 1{n-k})I_{k-1}I_{k+1} \leq I_k^2\).
注意最后一个猜想等价于序列 \(\frac{I_k}{\binom n k}\) 是对数凸的. 而所有集合都是独立集的拟阵满足 \(I_k = \binom n k\), 所以某种意义上这个不等式无法继续改进.
Adiprasito, Huh 和 Katz 基于 Hodge 理论证明了 Mason 猜想的第一个版本, 但最后一个版本的解决却变得更加初等了, 或者说, 人们识别出了这一类凸性问题的更加本质的原因.
问题的最终解决是由两组人独立完成的.
定理. (Anari-Liu-Gharan-Vinzant, Brändén-Huh) Mason 超对数凸猜想成立.
他们的观察是, 拟阵的超对数凸性来源于一个更大的多项式族的对数凸性.
Brändén 和 Huh 从他们定义的 Lorentz 多项式出发. Lorentz 多项式是如此定义的:
- 记 \(\mathrm{H}_n^d\) 是 \(n\) 元 \(d\) 次齐次实系数多项式构成的空间.
- 首先考虑 \(d=2\), 定义 \(\mathring{\mathrm{L}}_n^2\subset \mathrm{H}_n^2\) 由这样的二次型 \(Q\) 构成: 它所有 (\(2\) 次单项式) 系数都是正的, 而且有一个正特征根, 其他的特征根都是负的. 这被称为 Lorentz 特征 (Lorentzian signature), 也是他们起名的原因.
- 接下来递归地对 \(d>2\) 定义 \(\mathring{\mathrm{L}}_n^d\subset \mathrm{H}_n^d\): 一个 \(d\) 次多项式 \(P\) 在 \(\mathring{\mathrm{L}}_n^d\) 中, 如果对每个变量 \(x_i\) 求导得到的 \(d-1\) 次多项式 \(\partial_i P\) 都在 \(\mathring{\mathrm{L}}_n^{d-1}\) 中.
- 最后, \(n\) 元 \(d\) 次 Lorentz 多项式 \(\mathrm{L}_n^d\) 是 \(\mathring{\mathrm{L}}_n^d\) 的闭包, 拓扑是系数构成的有限维实空间的拓扑.
而 Anari, Liu, Gharan 和 Vinzant 的出发点考虑的是 完全对数凸 (completely log-concave) 多项式.
- 我们首先将关心的多项式 \(P\) 限制在那些系数非负的情况下.
- 此时, 我们称 \(P\) 是对数凸的, 如果对于 \(x, y \in \mathbb R_{\geq 0}^n\), 和 \(0\leq \lambda \leq 1\), 有 \(P(x)^{\lambda} P(y)^{1-\lambda} \leq P(\lambda x + (1-\lambda) y)\).
- 我们称 \(P\) 是完全对数凸的, 如果它通过任何非负方向的任意阶导数都是对数凸的. 我们记 \(D_v = \sum v_i \partial_i\), 那么对于任意 \(v_1,\dots,v_k\in \mathbb R_{\geq 0}^n\), 有 \(D_{v_1} \cdots D_{v_k} P\) 是对数凸的.
实际上, 可以证明 \(n\) 元齐次的完全对数凸多项式就等价于 Lorentz 多项式. 不过我们这里主要展示 Anari-Liu-Gharan-Vinzant (ALGV) 的证明 (Brändén-Huh 应该没有本质区别, 但他们的写作目标是对于 Lorentz 多项式进行详尽的分析, 所以把对于 Mason 猜想的证明打散了), 从证明中我们可以感受到这几个概念互相之间的联系.
首先, 让我们证明对于对数凸性的一些基本刻画. 首先我们将全局的对数凸性转化成局部. 我们知道一个 (性质足够好的) 函数是凸的就是说处处 \(\nabla^2 \leq 0\). (这里的 \(\leq\) 是指半负定.) 我们这里说一个多项式在 \(x=a\) 处对数凸, 就是 \(\nabla^2 (\log P(a)) \leq 0\).
引理. 对于 \(n\) 元齐次 \(d\geq 2\) 次多项式 \(P\) 且 \(P(a)\neq 0\), 记 \(Q = \nabla^2 P(a)\), 以下等价:
- \(P\) 在 \(x=a\) 处对数凸.
- 二次型 \(Q\) 在 \((Qa)^\perp\) 这个子空间上是半负定的.
- 对于每个 \(b\in \mathbb R_{\geq 0}^n\), 如果 \(Qb\neq 0\), 那么 \(Q\) 在 \((Qb)^\perp\) 上是半负定的.
- \(Q\) 在某个 \(n-1\) 维子空间上是半负定的.
- \((a^{\mathsf T} Q a)Q - (Qa)^{\mathsf T} (Qa)\leq 0\).
- (如果 \(d\geq 3\)) \(D_a P\) 在 \(x=a\) 处对数凸.
证明. 首先我们要对
进行基本的变形. 由于 \(P\) 是 \(d\) 次齐次多项式, 我们有
\(a^\sfT Q a = d(d-1) f(a)\), 并且 \(Qa = (d-1) (\nabla P)(a)\). 从而可以我们可以把所有的项都只用 \(Q\) 表示:
这个分析也说明了 \(a^\sfT Q a > 0, Qa \neq 0\).
\(1\implies 2\): 如果 1 成立, 也就是 \((a^\sfT Q a) Q - \frac{d}{d-1}(Qa)^\sfT (Qa)\leq 0\). 那么限制在 \((Qa)^\perp\) 也就消掉了 \((Qa)^\sfT (Qa)\) 这项. 所以限制在这个子空间上就是负定的.
\(2\implies 4\): 显然.
\(4\implies 5\): 考虑 \(P\) 是一个 \(2\times n\) 的两行向量, 分别是 \(a, b\). 接下来考虑矩阵
当 \(a, b\) 不共线, 那么 \(P^\sfT Q P\) 如果看做 \(Q\) 限制在 \(P\) 张成的子空间上的矩阵, 这个子空间必然和 \(n-1\) 维的那个半负定子空间有交, 这说明 \(P^\sfT Q P\) 不是半正定的. 另一方面, 因为 \(a^\sfT Q a > 0\), 所以 \(P^\sfT Q P\) 也不能是半负定的. 这说明这个矩阵有一个正特征值和一个负特征值, 也即 \(\det(P^\sfT Q P) = a^\sfT Q a \cdot b^\sfT Q b - (a^\sfT Q b)^2 \leq 0\). 由于这是对所有 \(b\) 都成立, 所以我们有 \((a^\sfT Q a) Q - (Qa)^\sfT (Qa)\leq 0\).
\(5\implies 1\): 既然 \((a^\sfT Q a) Q - (Qa)^\sfT (Qa)\leq 0\), 那么再减去 \(\frac 1{d-1} (Qa)^\sfT (Qa)\) 就更是 \(\leq 0\).
\(3\implies 4\): 显然.
\(4\implies 3\): 如果 4 成立, 那么 1 成立, 由于 \(Q\) 是二次多项式 \(\frac 12 x^\sfT Q x\) 的 Hesse 矩阵, 对这个二次多项式在 \(b\) 点出应用 2 就得到了 3.
\(1\iff 6\): 计算可得, \(D_a P\) 对应的在 \(a\) 处的 \(Q\) 矩阵就是 \((d-2)Q\), 那么根据 2 的刻画, \(P\) 和 \(D_a P\) 在 \(a\) 处对数凸是等价的. \(\square\)
现在有了这些基本道理之后, 让我们看看它为什么可以帮助我们证明 Mason 超对数凸猜想.
首先让我们考虑这样一个多项式, 它基本上就是把拟阵挂在生成函数上:
ALGV 的思路是这样的: 首先证明 \(g_E\) 是完全对数凸的, 然后直接把它拍平成
容易验证 \(g_E\) 的完全对数凸性可以推出 \(g\) 的完全对数凸性. 然后, 为了验证在 \(k\) 处的超对数凸性, 只需考虑
由于对数凸性, 这个 Hessian 的行列式应该 \(\leq 0\), 也就有
整理一下, 得到
这样就证明了 Mason 超对数凸猜想. 可见, 问题的关键在于验证生成函数的完全对数凸性.
完全对数凸性难以验证的一点是我们要对任意阶任意方向组合的导数都证明是对数凸的. 而 Lorentz 多项式的定义上看, \(\mathring{\mathrm{L}}\) 只需要对 \(x_i\) 这些方向的导数验证即可, 看起来很简单.
问题出现在哪? 问题在于, 像 \(g_E\) 这样的生成函数, 它落在 Lorentz 多项式的边界上, 使得它们完全对数凸性要来源于某些更细致的观察.
具体来说, 有如下刻画:
定理. 一个 \(d\geq 2\) 次齐次多项式 \(P\) 是完全对数凸的, 当且仅当:
- 对于 \(\ell \leq d-2\), 任意的 \(\partial_{i_1} \cdots \partial_{i_\ell} P\) 都是 不可分解 的, 也即, 它不能写成两个变量不交的 (非零) 系数非负多项式的和.
- 任意的 \(\partial_{i_1} \cdots \partial_{i_{d-2}} P\) 都是对数凸的.
我们可以看到, 第二个条件无非是 \(\mathring{\mathrm L}\) 的定义中, 把严格不等式改成了不等式, 而第一个条件是一个更加细致的要求. 它刻画了 Lorentz 多项式, 或者说完全对数凸多项式的边界情况, 这是真正复杂的情况.
证明. \(\implies\) 的方向是比较显然的, 我们主要需要注意到所有可分解的多项式都不可能是完全对数凸的, 这划归到 \(x_1^2 + x_2^2\) 的情况, 而这个多项式的 Hessian 是正定的, 所以不是对数凸的.
另一个方向则需要多费些功夫.
引理. 如果 \(f, g\) 是两个齐次非负系数多项式, 且 \(D_b f = D_c g \neq 0\) (\(b,c\in\mathbb R_{\geq 0}^n\)), 而且 \(f, g\) 对数凸, 那么 \(f+g\) 对数凸.
证明. 首先 \(f, g\) 是同次的, 设为次数 \(d\).
对于每个 \(a\) 证明 \(f+g\) 在 \(a\) 处对数凸. 首先记 \(Q_1 = \nabla^2 f(a), Q_2 = \nabla^2 g(a)\). 根据求导的交换性, 我们有 \(Q_1 b = Q_2 c\). 由于 \(D_b f \neq 0\), 有 \(Q_1 b \neq 0\), 根据凸性刻画的 \(1\implies 3\) 方向, \(Q_1, Q_2\) 在 \((Q_1 b)^\perp = (Q_2c)^\perp\) 上是半负定的, 进而在这个子空间上 \(f+g\) 半负定, 也即对数凸. \(\square\)
引理. 如果 \(f\) 是不可分解的其次 \(d\geq 3\) 次非负系数多项式, 每个 \(\partial_i f\) 都对数凸, 那么每个 \(D_a f\) 都对数凸.
首先不妨把所有没出现的变量都去掉. 那么将 \(\partial_i \partial_j f \neq 0\) 的点连边, 这个图是连通图. 不妨将变量重新标号, 使得每个 \(i > 1\) 都存在 \(j<i\) 使得 \(\partial_i \partial_j f \neq 0\).
接下来, 考虑一个 \(a \in \mathbb R_{> 0}^n\), 注意这里是严格正的. 我们归纳地证明对于每个 \(k\leq n\), \(b = \sum_{i=1}^k a_i e_i\) 都有 \(D_b f\) 对数凸. 首先 \(k=1\) 的情况显然. 对于 \(k\) 成立的情况, 我们欲证 \(k+1\) 的情况. 记 \(c = a_{k+1} e_{k+1}\), 我们欲证的就是 \(D_{b+c} f = (D_b+D_c) f\) 对数凸.
考虑 \(D_b D_c f = D_c D_b f\), 由于 \(f\) 是不可分解的, 它非零 (这里用到了 \(a\) 是严格正的), 所以将上一条引理用于 \(D_c f, D_b f\), 就得到了 \((D_b+D_c)f\) 对数凸.
根据归纳法, \(D_a f\) 总是对数凸的. 最后一步是注意到: 凸性可以在每个局部检查, 而局部检查都是可以取极限的, 所以 \(a\in \mathbb R_{>0}^n\) 就可以过渡到 \(a\in \mathbb R_{\geq 0}^n\). \(\square\)
最后我们证明定理. 我们首先归纳证明 \(P\) 对数凸, 如果 \(P\) 满足题设的诸条件, 那么根据归纳假设, \(\partial_i P\) 都是对数凸的, 而上述引理保证, 每个 \(D_a P\) 都是对数凸的. 最后, 根据凸性等价性的第 6 条判准, 推出 \(P\) 对数凸.
接下来我们证明完全对数凸. 还是先归纳假设诸 \(\partial_i P\) 都完全对数凸, 那么对于任何 \(D_{v_1}\cdots D_{v_k} P\), 由于
后者是对数凸的, 所以前者也是对数凸的. 然后论证道理相同. \(\square\)
最后, 我们只需要验证 \(g_E(y,z_1,\dots,z_n)\) 满足定理的条件.
证明. 对于求导 \(\partial_y^k \partial_z^S\), 由于对 \(S\) 部分求导无非变成了考虑全体包含 \(S\) 的那些独立集, 它们如果非空, 挖掉 \(S\) 之后就还是拟阵, 所以我们证明所有拟阵的时候, 只用考虑 \(S\) 是空集的情况. 同样, 不妨每个 \(z_i\) 都在拟阵里出现过.
首先验证不可分解性. 考虑求导 \(\partial_y^k\), 因为所有 \(z_i y^{n-k-1}\) 都会出现, 所以每个点都和 \(y\) 是连通的. 这就说明了 \(g_E\) 的任何导数都是不可分解的.
接下来验证对数凸性. 只需考虑 \(k=n-2\) 的情况, 我们要算 \(\nabla^2 \partial_y^{n-2} g_E\), 经过计算, 它缩放之后等于
结合拟阵的一个观察, 所有大小为 \(2\) 的独立集有如下刻画: 存在等价类划分 \(\sim\), 使得 \(\{i, j\} \in \mathcal I\) 当且仅当 \(i\not \sim j\).
取 \(a = (1, 0, \dots, 0)\), 通过计算可以发现 \((a^\sfT Q a) Q - (Qa)^\sfT (Qa)\leq 0\), 进而 \(g_E\) 完全对数凸. \(\square\)
将上述的一切综合起来, 我们就证明了 Mason 超对数凸猜想.
人生
上面这两个的东西是 24 年秋学期的时候蹭了丘中心的一门叫做 "组合与几何" 的课的时候学的. 另外, 因为这个课是讨论班形式, 我负责的刚好是 Stanley 不等式相关的这部分, 感到有些恍惚.
显然, 这不是我第一次知道 R. Stanley 了. 我第一次知道 Stanley 是因为组合计数.
时间回到小学的时候, 我第一次接触组合计数恐怕是小学奥数有一些排列组合的内容, 当时我深受其扰, 后来也不学了. 当时可能也没想到之后会发生什么. 即使是一开始搞 oi 的时候, 我也觉得容斥原理之内的技巧都十分困难. 不过后来还是编出了自己理解这些事物的一套办法, 也在这段时间听说了 Stanley 和他的 计数组合.
本来选这门课, 是看见教学大纲上讲 Kakeya 集引出的多项式方法之类的东西, 现在看来是大纲忘了换了. 可能这就是冥冥之中命运的指引, 让我一次次回到同一个地方.
证明 Stanley 不等式的观察的关键一步, 是考察一些不等式约束对应的几何, 每个合法的排列对应了实数坐标的单纯形, 也让我回想起了出 新年的军队 这道题的时候.
毫无疑问, 我从这门课上学到的东西都是十分美丽的. 每当我学到了美丽的东西之后, 在高兴之余又会恍惚. 前人们挥洒他们的汗水, 热诚和克服了无数的困难, 那是我们从留下的 "冰冷的美丽" 里看不到的困难, 为了带给我们最终的, 最美好的那一面. 而我望向我选择的那一条路, 不知道我能否有足够的运气和能力, 为这个世界的花园添上一抹色彩.
况且我选择了一条似乎不太相同的路. 组合, 或许不该用这个词概括, 但它确乎以不同的形式一次次重新出现在我的生活中, 仿佛是命运的指引. 可是命运终究没有指引我留在这里.
但我总相信, 这些事情终究给我的不会仅仅是悲伤的回忆. 正是因为我们在生命中见到了一些美丽的事物, 它们才教会我们如何做我们该做的事, 如何当应当的人.
我多么想要感谢我有幸见到听到的一切, 但我不善言辞, 唯有将这一切融入到我未来的行为和宣告之中.

浙公网安备 33010602011771号