二次型矩阵

二次型矩阵

引言

小C得到了一些二元二次函数,不过这些函数长得有点?

别人的函数:有二次项、一次项和常数项。

小C的函数:只有二次项。

就很……你懂的

我们称,只有二次项的n元齐次多元函数为二次型函数。

众所周知,小C很喜欢线性代数,因此她在想,这个函数,能不能用矩阵的运算来表达呢?

定义

我们称一个二次型矩阵满足:

\(f(x_1,x_2,\dots,x_n)\) 为二次型函数,\(X = [x_1,x_2,\dots,x_n]^T\)

那么这个函数对应的二次型矩阵 \(A\) ,满足:

  1. 是一个 \(n\times n\)对称矩阵
  2. 满足等式:\(f(x_1,x_2,\dots,x_n)=X^TAX\)

那么,构造一个二次型矩阵是非常简单的:

  1. 对角线元素为对应的平方项系数
  2. 非对角线元素 \(A_{i,j}=A_{j,i}\)\(x_ix_j\) 项的一半。

得到这样一个结果是很容易的。不过小E却说:“为啥要这么麻烦啊?直接代数不是很好吗?”

几何意义

众所周知,线性代数不考虑几何意义,就等于玩游戏不玩原神,吃薯条不蘸番茄酱……

二次型矩阵同样拥有其几何意义。

我们知道,二次型矩阵是一个对称矩阵,那么它也应该拥有对称矩阵的所有性质,比如最经典的:可对角化。

考虑到,对每一组向量,带到函数里面都会算出一个值。这里以二元函数为例,那么最终会在三维空间进行作图。

那么,一个向量 \(\vec x\) 通过右乘一个二次型矩阵,就会被拉伸、旋转。

考虑一个圆表示一堆向量,那么最后这个图形会被拉伸到一个椭圆,同时伴随着旋转等。

在向下解释前,我们需要讲一个特殊的二次型矩阵:标准型矩阵。

标准型矩阵

考虑到,对于二次型矩阵 \(A\),总是存在一组标准正交的特征向量组。用这个特征向量组构造出的 \(P\) 是正交矩阵,那么就会有 \(P^{-1}=P^T\)。注意,这里的特征向量要求正交且单位化。

同时,我们知道,对称矩阵总是能对角化,那么取这样一组特征向量组,就会有 \(A=P^{-1}\Lambda P=P^T\Lambda P\)

那么带到函数里面,就会有:\(x^TAx=x^TP^{-1}\Lambda Px=x^TP^T\Lambda Px=(Px)^T\Lambda (Px)\)

\(y=Px\),那么最终的函数 \(f(y)=y^T\Lambda y=\sum_{i=1}^n\lambda_iy_i^2\)

我们称 \(\Lambda\)\(A\) 的标准化矩阵。

值得注意的是,A的标准化矩阵会有很多种(无数种)。

当然,这里还有一些其他求标准化矩阵的方法。

\[\begin{bmatrix} A\\ I \end{bmatrix} \xrightarrow[I跟随A作初等列变换]{A作初等变换变换成对角矩阵D} \begin{bmatrix} D\\ C \end{bmatrix} \]

那么可知 \(C^{T}AC=D\)

\(x=Cy\),那么有

\(f(y)=x^TAx=y^{T}C^TACy\)

正定,负定等

考虑将一个二次型矩阵 \(A\) 转化为标准型矩阵 \(\Lambda\)

那么我们发现,这个函数的值就变成了 \(f(y)=y^T\Lambda y=\sum_{i=1}^n\lambda_iy_i^2\)

注意到,这个柿子中,\(y^2\) 总是正数(只考虑实数),那么这个函数的正负就完全取决于特征值了。

那么我们进行如下讨论:

  1. 正定:\(\forall y\neq \vec 0,f(y)>0\)
  2. 负定:\(\forall y\neq \vec 0,f(y)<0\)
  3. 半正定:\(\forall y\neq \vec 0,f(y)\ge 0\)
  4. 半负定:\(\forall y\neq \vec 0,f(y)\le 0\)
  5. 不定:\(\exist y\neq \vec 0,f(y)<0\),且 \(\exist y\neq \vec 0,f(y)>0\)

不过,对于对角矩阵,判定其正定是很容易的,但对于普通的矩阵,这是很困难的。那么我们希望,在经过变换后,能够有什么东西仍然不变。

规范型

小E:刚刚不是有个什么二次型、标准型吗,怎么又来一个规范型😭

定义:

假设 \(f(x)=x^TAx\),且存在 \(x=Py\),使得 \(f(x)=y^TP^TAPy=g(y)=y^T\begin{bmatrix} I_s&O&O\\O&-I_t&O\\O&O&O \end{bmatrix}y\)

其中,\(s+t=r(A)\)\(g(y)\) 被称为 \(f(x)\) 的规范型。

我们称s为正惯性指数,t为负惯性指数。

惯性定理

Sylvester惯性定理:指在实数域中,一个形如 \(a_{11}x_1^2 + a_{12}x_1x_2 + a_{13}x_1x_3 + \cdots + a_{nn}x_n^2\) 的二次型通过线性变换可以化简成唯一的标准型 \(y_1^2 + y_2^2 + \cdots + y_p^2 - y_{p+1}^2 - \cdots - y_r^2\)。其中的正项数(称为正惯性系数 \(p\))、负项数(称为负惯性系数 \(r-p\))以及 \(0\) 的数目唯一确定,其中的 \(r\) 为系数矩阵的秩。

证明略(由于太长了)

那么根据这个定理,再来判定一个二次型矩阵的正定还是负定就很好办了

小E:👍

顺序主子式与正定性

纵使我们知道,线性变换不会改变惯性指标,但是将一个矩阵转换成对角矩阵还是太麻烦了。那么有没有不吃操作的方法呢?

有的兄弟有的😁,像这样不吃操作的方法还有一种:由顺序主子式判定正定还是负定。

首先介绍顺序主子式,其实很简单,你把左上角扣一个 \(k\times k\) 的子矩阵下来,然后求它的行列式就是第 \(k\) 个顺序主子式的值。

那么有如下定理:

  1. A为正定矩阵,等价于,A的各阶顺序主子式大于零
  2. A为负定矩阵,等价于,A的奇数阶顺序主子式小于零,偶数阶大于零。
posted @ 2026-06-10 16:30  Call_me_Eric  阅读(9)  评论(0)    收藏  举报
Live2D