线性代数 - 矩阵
线性代数 - 矩阵
整理矩阵相关知识点
1 基础
1.1 矩阵运算
-
\(\boldsymbol{A+B=C}\) (矩阵加法)
满足 \(c_{ij}=a_{ij}+b_{ij}\) 。 -
\(\boldsymbol{AB=C}\) (矩阵乘法)
满足 \(c_{ij}=\displaystyle\sum_{k=1}^{n}a_{ik}b_{kj}\) 。 -
\(\boldsymbol{A}(\boldsymbol{BC})=(\boldsymbol{AB})\boldsymbol{C}\) (矩阵乘法满足结合律)
证明:对左式,\(\boldsymbol{BC}=(bc_{ij})\) ,\(bc_{ij}=\displaystyle\sum_{k=1}^{n}b_{ik}c_{kj}\) ,故 \(a(bc)_{ij}=\displaystyle\sum_{k=1}^{n}a_{ik}bc_{kj}=\displaystyle\sum_{k=1}^{n}(a_{ik}\displaystyle\sum_{l=1}^{n}b_{kl}c_{lj})\) ,对右式,\((ab)c_{ij}=\displaystyle\sum_{k=1}^{n}[(\displaystyle\sum_{l=1}^{n}a_{il}b_{lk})c_{kj}]\) 。故有 \(a(bc)_{ij}=(ab)c_{ij}=\displaystyle\sum_{l=1}^{n}\sum_{k=1}^{n}a_{il}b_{lk}c_{kj}\) 。
-
\(\boldsymbol{A}(\boldsymbol{B+C})=\boldsymbol{AB}+\boldsymbol{AC}\) (矩阵乘法满足分配律)
-
\((\boldsymbol{A}+\boldsymbol{B})\boldsymbol{C}=\boldsymbol{AC}+\boldsymbol{BC}\)
-
\((\boldsymbol{AB})^T=\boldsymbol{B}^T\boldsymbol{A}^T\) (矩阵的转置)
证明:
\((\boldsymbol{AB})^T=\boldsymbol{M}\),\(\boldsymbol{B}^T\boldsymbol{A}^T=\boldsymbol{N}\) 。
\(m_{ij}=\displaystyle\sum_{k=1}^{n}a_{jk}b_{ki}\) 。
\(n_{ij}=\displaystyle\sum_{k=1}^{n}b_{ki}a_{jk}\) 。 -
\(|\boldsymbol{AB}|=|\boldsymbol{A}||\boldsymbol{B}|\) (矩阵乘法与行列式的值)
证明:
思路:
\(D=\begin{vmatrix} \boldsymbol{A} & \boldsymbol{O} \\ \boldsymbol{E} & \boldsymbol{B} \end{vmatrix}\)
\(D=|\boldsymbol{A}||\boldsymbol{B}|\)
而 \(\begin{vmatrix} \boldsymbol{A} & \boldsymbol{O} \\ \boldsymbol{-E} & \boldsymbol{B} \end{vmatrix}\overset{col}{\sim} \begin{vmatrix} \boldsymbol{A} & \boldsymbol{AB} \\ -\boldsymbol{E} & \boldsymbol{O} \end{vmatrix}=|\boldsymbol{AB}|\)
1.2 伴随矩阵
-
行列式 \(|\boldsymbol{A}|\) 的各元素的代数余子式 \(A_{ij}\) 构成的如下矩阵
\(\boldsymbol{A}^*=\begin{pmatrix} A_{11} & A_{12} & ... & A_{1n} \\ A_{21} & A_{22} & ... & A_{2n} \\ ... \\ A_{n1} & A_{n2} & ... & A_{nn} \end{pmatrix}^{T}\)
称为 \(\boldsymbol{A}\) 的伴随矩阵。
-
\(\boldsymbol{A}^*\boldsymbol{A}=\boldsymbol{A}\boldsymbol{A}^*=|\boldsymbol{A}|\boldsymbol{E}\)
证明:由行列式代数余子式的性质可证。
1.3 可逆矩阵
- 对 \(n\) 阶矩阵 \(\boldsymbol{A},\boldsymbol{B}\) ,若有 \(\boldsymbol{AB}=\boldsymbol{BA}=\boldsymbol{E}\) ,其中 \(\boldsymbol{E}\) 为单位矩阵。则称矩阵 \(\boldsymbol{A}\) 可逆,并称 \(\boldsymbol{B}\) 为 \(\boldsymbol{A}\) 的逆矩阵。记 \(\boldsymbol{A}\) 的逆矩阵为 \(\boldsymbol{A}^{-1}\) 。
- 矩阵 \(\boldsymbol{A}\) 可逆,则 \(|\boldsymbol{A}|\ne 0\) 。
- 矩阵 \(\boldsymbol{A}\) 可逆,则 \(\displaystyle\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|}\boldsymbol{A}^*\) 。
证:\(\boldsymbol{A}\boldsymbol{A}^*=|\boldsymbol{A}|\boldsymbol{E}\) ,故 \(\boldsymbol{A}^*=|\boldsymbol{A}|\boldsymbol{A}^{-1}\) ,得证。
- \((\boldsymbol{AB})^{-1}=\boldsymbol{B}^{-1}\boldsymbol{A}^{-1}\)
证:\((\boldsymbol{AB})^{-1}(\boldsymbol{AB})=\boldsymbol{B}^{-1}\boldsymbol{A}^{-1}(\boldsymbol{AB})=\boldsymbol{E}\) ,而 \(\boldsymbol{AB}\) 可逆,故得证。
1.4 矩阵的秩
\(k\) 阶子式:从 \(\boldsymbol{A}_{mn}\) 的选定 \(k\) 行和 \(k\) 列,取这些行列交叉处的元素按原来的相对位置构成的 \(k\) 阶行列式称为 \(k\) 阶子式。
矩阵的秩:矩阵的最高阶非零子式称为矩阵的秩。
2 矩阵的初等变换
-
对矩阵作如下变换:
- 对调
- \(k\) 乘
- \(k\) 乘加
称为初等变换。
-
单位矩阵经过一次初等变换,得到初等矩阵。
-
对一个矩阵进行一次列初等变换,相当于左乘一个初等矩阵;对一个矩阵执行一次行初等变换,相当于右乘一个初等矩阵。
-
如果矩阵 \(\boldsymbol{A}\) 经有限次初等变换变成 \(\boldsymbol{B}\) ,就称矩阵 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 等价。
-
矩阵变换与矩阵乘法
- \(\boldsymbol{A}\overset{row}{\sim}\boldsymbol{B} \iff\) 存在可逆矩阵 \(\boldsymbol{P}\) ,使 \(\boldsymbol{PA}=\boldsymbol{B}\)
- \(\boldsymbol{A}\overset{col}{\sim}\boldsymbol{B} \iff\) 存在可逆矩阵 \(\boldsymbol{Q}\) ,使 \(\boldsymbol{AQ}=\boldsymbol{B}\)
- \(\boldsymbol{A}\overset{}{\sim}\boldsymbol{B} \iff\) 存在可逆矩阵 \(\boldsymbol{P},\boldsymbol{Q}\) ,使 \(\boldsymbol{PAQ}=\boldsymbol{B}\)
-
初等变换不改变矩阵的秩
3 线性方程组的解
对线性方程组
\(\begin{cases} a_{11}x_1+a_{12}x_2+...+a_{1n}x_n=b_1\\ a_{21}x_1+a_{22}x_2+...+a_{2n}x_n=b_2\\ ...\\ a_{n1}x_1+a_{n2}x_2+...+a_{nn}x_n=b_n \end{cases}\)
记为 \(\boldsymbol{Ax}=\boldsymbol{b}\) 。
- 无解 \(\iff\) \(R(\boldsymbol{A})<R(\boldsymbol{A},\boldsymbol{b})\)
- 有唯一解 \(\iff\) \(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})=n\)
- 有无限多解 \(\iff\) \(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})<n\)
理解:第一种情况表示 \(\boldsymbol{A}\) 所在的线性空间的维数小于 \(\boldsymbol{b}\) 所在的线性空间的维数,因此 \(\boldsymbol{A}\) 无法表示 \(\boldsymbol{b}\) 。如果两者相等,则能够线性表示。
当 \(b_i\) 为 \(0\) 时,线性方程组转化为齐次线性方程组。即 \(\boldsymbol{Ax}=\boldsymbol{0}\) 。
对 \(\boldsymbol{Ax}=\boldsymbol{0}\) :
- 考虑矩阵的秩为最大非零子式,因此 \(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})\) 。因此当 \(R(\boldsymbol{A})=n\) 时,仅有唯一解 \(\boldsymbol{x}=\boldsymbol{0}\) ,当 \(R(\boldsymbol{A})<n\) 时,有非零解。
- 设 \(m\times n\) 矩阵 \(\boldsymbol{A}\) 的秩 \(R(\boldsymbol{A})=r\) ,则 \(n\) 元齐次线性方程组 \(\boldsymbol{Ax}=\boldsymbol{0}\) 的解集 \(S\) 的秩为 \(R_S=n-r\) 。
4 向量组的线性相关性
-
向量 \(\boldsymbol{b}\) 能由向量组 \(A\):\(\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_m}\) 线性表示 \(\iff\) \(R(\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_m})=R(\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_m},\boldsymbol{b})\)
-
两个向量线性相关的几何意义是两个向量共线(平行)
-
三个向量线性相关的几何意义是三个向量共面
5 向量空间
- 在线性代数课程中,一般习惯把列向量 \(\begin{pmatrix} x_1\\x_2\\...\\x_n \end{pmatrix}\) 记作 \(\boldsymbol{a}\) ,而把行向量 \(\begin{pmatrix} x_1,x_2,...,x_n \end{pmatrix}\) 记作 \(\boldsymbol{a}^T\) 。此时一个 \(n\) 阶矩阵可以记为 \(\begin{pmatrix} \boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_n} \end{pmatrix}\) 或 \(\begin{pmatrix} \boldsymbol{a_1}^T\\ \boldsymbol{a_2}^T\\ ...\\ \boldsymbol{a_n}^T \end{pmatrix}\) 。
- 设 \(V\) 为 \(n\) 维向量的集合,如果集合 \(V\) 非空,且集合 \(V\) 对于向量加法和向量数乘运算封闭(运算的结果仍然在集合内),则称集合 \(V\) 为向量空间。(\(\boldsymbol{v_1}+\boldsymbol{v_2}\),\(k{\boldsymbol{a}}\))
- 线性方程组的解集 \(S=\{\boldsymbol{x}|\boldsymbol{Ax}=\boldsymbol{0}\}\) 是一个向量空间。
- 由向量组 \(\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_m}\) 生成的向量空间为 \(L=\{\boldsymbol{x}=\lambda_1\boldsymbol{a_1}+\lambda_2\boldsymbol{a_2}+...+\lambda_m\boldsymbol{a_m}\}\) 。
- 对向量空间 \(V\) ,若 \(r\) 维向量组满足线性无关且向量空间内任一向量都能被向量组线性表示,则称向量组为向量空间 \(V\) 的一个基,\(r\) 称为向量空间的维数。若某个基的所有向量都是单位向量(即为单位坐标向量组),则称为自然基。
- 若向量空间中的有一个基,则向量空间中任一向量 \(\boldsymbol{x}\) 可被惟一表示为 \(\boldsymbol{x}=\lambda_1\boldsymbol{a_1}+\lambda_2\boldsymbol{a_2}+...+\lambda_m\boldsymbol{a_m}\) ,称 \((\lambda_1,\lambda_2,...,\lambda_m)\) 为 \(\boldsymbol{x}\) 在对应基中的坐标。
- 对于向量空间 \(R^n\) 的两个基 \(\boldsymbol{A},\boldsymbol{B}\) ,记变换 \(\boldsymbol{B}=\boldsymbol{AP}\) 为基 \(\boldsymbol{A}\) 到 \(\boldsymbol{B}\) 的基变换公式,其中 \(\boldsymbol{P}\) 称为从基 \(\boldsymbol{A}\) 到基 \(\boldsymbol{B}\) 的过渡矩阵,且 \(\boldsymbol{P}=\boldsymbol{A}^{-1}\boldsymbol{B}\)。
- 向量空间 \(R^n\) 中,取向量 \(\boldsymbol{x}\) 在两个基 \(\boldsymbol{A},\boldsymbol{B}\) 中的坐标分别为 \(\boldsymbol{\lambda_A},\boldsymbol{\lambda_B}\) ,则有 \(\boldsymbol{A\lambda_A}=\boldsymbol{B\lambda_B}\) ,即有 \(\boldsymbol{\lambda_B}=\boldsymbol{B}^{-1}\boldsymbol{A\lambda_A}\) ,称为向量从基 \(\boldsymbol{A}\) 到基 \(\boldsymbol{B}\) 的坐标变换公式。记 \(\boldsymbol{P}\) 为过渡矩阵,则有 \(\boldsymbol{\lambda_B}=\boldsymbol{P}^{-1}\boldsymbol{\lambda_A}\) 。
6 内积与正交
-
若 \(\boldsymbol{a}=(a_i)^\text{T}\) ,\(\boldsymbol{b}=(b_i)^\text{T}\) ,规定 \([\boldsymbol{a},\boldsymbol{b}]=\sum a_ib_i\) 为向量 \(\boldsymbol{a}\) 和 向量 \(\boldsymbol{b}\) 的内积。\([\boldsymbol{a},\boldsymbol{b}]=\boldsymbol{a}^\text{T}\boldsymbol{b}\) 。向量内积是向量数量积的推广。
-
当 \([\boldsymbol{a},\boldsymbol{b}]=0\) 时,称向量 \(\boldsymbol{a}\) 与 \(\boldsymbol{b}\) 正交。
-
基的规范正交化:先对基进行正交化,然后对基进行规范化。
\(\boldsymbol{b_1}=\boldsymbol{a_1}\)
\(\boldsymbol{b_2}=\boldsymbol{a_2}-\frac{[\boldsymbol{a_2},\boldsymbol{b_1}]}{[\boldsymbol{b_1},\boldsymbol{b_1}]}\boldsymbol{a_1}\)
\(\boldsymbol{b_3}=\boldsymbol{a_3}-\frac{[\boldsymbol{a_3},\boldsymbol{b_1}]}{[\boldsymbol{b_1},\boldsymbol{b_1}]}\boldsymbol{b_1}-\frac{[\boldsymbol{a_3},\boldsymbol{b_2}]}{[\boldsymbol{b_2},\boldsymbol{b_2}]}\boldsymbol{b_2}\) -
若 \(\boldsymbol{A}^{\text{T}}\boldsymbol{A}=\boldsymbol{E}\) ,则称 \(\boldsymbol{A}\) 为正交矩阵。正交矩阵的所有列向量构成一个规范正交基。
-
若 \(\boldsymbol{A}\) 为正交阵,则 \(\boldsymbol{A}^{\text{T}}=\boldsymbol{A}^{-1}\) ,\(|\boldsymbol{A}|=1\) 。
证明:\(|\boldsymbol{A}^{\text{T}}||\boldsymbol{A}|=|\boldsymbol{A}|^2=1\)
-
若 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 都是正交阵,则 \(\boldsymbol{AB}\) 是正交阵。
证明:\((\boldsymbol{AB})^{\text{T}}\boldsymbol{AB}=\boldsymbol{E}\) 。
7 特征值和特征向量
- 设 \(\boldsymbol{A}\) 是 \(n\) 阶矩阵,如果 \(\lambda\) 和 \(n\) 维非零向量 \(\boldsymbol{x}\) 使关系式 \(\boldsymbol{Ax}=\lambda\boldsymbol{x}\) 成立,则 \(\lambda\) 称为矩阵 \(\boldsymbol{A}\) 的特征值, 非零向量 \(\boldsymbol{x}\) 称为 \(\boldsymbol{A}\) 的对应于特征值 \(\lambda\) 的特征向量。
- 对特征值和特征向量,\((\boldsymbol{A}-\lambda \boldsymbol{E})\boldsymbol{x}=\boldsymbol{0}\) ,即这个方程有非零解,故 \(|\boldsymbol{A}-\lambda \boldsymbol{E}|=0\) 。\(|\boldsymbol{A}-\lambda \boldsymbol{E}|=0\) 称为向量 \(\boldsymbol{A}\) 的特征多项式。
- 若 \(n\) 阶矩阵 \(\boldsymbol{A}\) 有特征值 \(\lambda\) 和 特征向量 \(\boldsymbol{\alpha}\) ,即有 \((\boldsymbol{A}-\lambda\boldsymbol{E})\boldsymbol{\alpha}=\boldsymbol{0}\) ,或者 \(\boldsymbol{A\alpha}=\lambda\boldsymbol{\alpha}\) 。
- \((\boldsymbol{A}+a\boldsymbol{E})\boldsymbol{\alpha}=(\lambda+a)\boldsymbol{\alpha}\) ,即 \(\boldsymbol{A}+a\boldsymbol{E}\) 有特征值 \(\lambda+a\) 。
- \((k\boldsymbol{A}-\lambda k\boldsymbol{E})\boldsymbol{\alpha}=\boldsymbol{0}\) ,即 \(k\boldsymbol{A}\) 的特征值 \(\lambda\) 。
- \((\boldsymbol{A}^2-\lambda\boldsymbol{A})\boldsymbol{\alpha}=\boldsymbol{0}\) ,而 \(\lambda\boldsymbol{A}=\lambda^2\boldsymbol{E}\) ,故 \(\boldsymbol{A}^2\) 有特征值 \(\lambda^2\) 。
- \((\boldsymbol{A}^n-\lambda\boldsymbol{A}^{n-1})\boldsymbol{\alpha}=\boldsymbol{0}\) ,则递归可证 \(\boldsymbol{A}^n\) 有特征值 \(\lambda^n\) 。
- \(f(x)\) 为 \(n\) 次多项式,\(f(\boldsymbol{A})\boldsymbol{\alpha}=(a_0\boldsymbol{E}+a_1\boldsymbol{A}+a_2\boldsymbol{A^2}+...+a_n\boldsymbol{A_n}^n)\boldsymbol{\alpha}=a_0\boldsymbol{\alpha}+a_1\lambda\boldsymbol{\alpha}+...+a_n\lambda^n\boldsymbol{\alpha}=f(\lambda)\boldsymbol{\alpha}\) ,即 \(f(\boldsymbol{A})\) 有特征值 \(f(\alpha)\) 。
- \(\boldsymbol{A\alpha}=\lambda\boldsymbol{\alpha}\) ,\(\boldsymbol{\alpha}=\lambda\boldsymbol{A}^{-1}\boldsymbol{\alpha}\) ,\((\boldsymbol{A}^{-1}-\frac{1}{\lambda}\boldsymbol{E})\boldsymbol{\alpha}=\boldsymbol{0}\) ,即 \(\boldsymbol{A}^{-1}\) 有特征值 \(\frac{1}{\lambda}\) 。
- \(\boldsymbol{A}\boldsymbol{A}^*=|\boldsymbol{A}|\boldsymbol{E}\) ,即 \(\boldsymbol{A}^*=|\boldsymbol{A}|\boldsymbol{A}^{-1}\) ,故 \(\boldsymbol{A}^*\) 有特征值 \(\frac{|\boldsymbol{A}|}{\lambda}\) 。
- 设 \(\lambda_1,\lambda_2,...,\lambda_m\) 是方阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{p_1},\boldsymbol{p_2},...,\boldsymbol{p_m}\) 依次是对应的特征向量,如果 \(\lambda_1,\lambda_2,...,\lambda_m\) 各不相等,则 \(\boldsymbol{p_1},\boldsymbol{p_2},...,\boldsymbol{p_m}\) 线性无关。
证明:若有 \(\boldsymbol{p_1},\boldsymbol{p_2},...,\boldsymbol{p_{m-1}}\) 线性无关,假设 \(x_1\boldsymbol{p_1}+x_2\boldsymbol{p_2}+...+x_m\boldsymbol{p_m}=\boldsymbol{0}\) (即线性相关),左乘 \(\boldsymbol{A}\) 有 \(\lambda_1 x_1\boldsymbol{p_1}+\lambda_2 x_2\boldsymbol{p_2}+...+\lambda_m x_m \boldsymbol{p_m}=\boldsymbol{0}\) ,消去 \(\lambda_m\) 项,有 \(x_1(\lambda_m-\lambda_1)\boldsymbol{p_1}+x_2(\lambda_m-\lambda_2)\boldsymbol{p_2}+...+x_{n-1}(\lambda_m-\lambda_{m-1})\boldsymbol{p_{m-1}}=\boldsymbol{0}\) ,故所有系数为 \(0\),而 \(\lambda\) 项各不相等,故有 \(x_i=0\) ,与假设矛盾。
- \(\sum \lambda_i=\sum a_{ii}\) ,\(\prod \lambda_i=|\boldsymbol{A}|\)
证明:对特征多项式 \(f(\lambda)=|\boldsymbol{A}-\lambda\boldsymbol{E}|=0\) ,\(f(\lambda)=(\lambda_1-\lambda)(\lambda_2-\lambda)...(\lambda_n-\lambda)=0\) ,其中 \(\lambda^0\) 系数为 \(\lambda_1\lambda_2...\lambda_n\) ,对应为 \(|\boldsymbol{A}|\) ,\(\lambda^{n-1}\) 项系数为 \((-1)^{n-1}(\lambda_1+\lambda_2+...+\lambda_n)\) ,对应为 \((-1)^{n-1}(a_{11}+a_{22}+...+a_{nn})\) ,得证。
8 相似矩阵
- 设 \(\boldsymbol{A},\boldsymbol{B}\) 都是 \(n\) 阶矩阵,若有可逆矩阵 \(\boldsymbol{P}\) ,使 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B}\) ,则称 \(\boldsymbol{B}\) 是 \(\boldsymbol{A}\) 的相似矩阵,或者说 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 相似。运算 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}\) 称为对 \(\boldsymbol{A}\) 进行相似变换。
- 相似矩阵的特征多项式相同,特征值相同。
-
\(|\boldsymbol{B}-\lambda \boldsymbol{E}|=|\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}-\lambda \boldsymbol{E}|=|\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}-\boldsymbol{P}^{-1}(\lambda\boldsymbol{E})\boldsymbol{P}|=|\boldsymbol{P}^{-1}||\boldsymbol{A}-\lambda\boldsymbol{E}||\boldsymbol{P}|=|\boldsymbol{A}-\lambda\boldsymbol{E}|\) 。
-
- 由于对角阵的特征值就是对角元素,因此如果矩阵能相似变换到对角阵,对角阵的对角元素就是矩阵的特征值。
- \(n\) 阶矩阵 \(\boldsymbol{A}\) 与对角阵相似(能相似对角化) \(\iff\) 矩阵有 \(n\) 个线性无关的特征向量
证明:设有可逆矩阵 \(\boldsymbol{P}\) ,使 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{\varLambda}\) ,即 \(\boldsymbol{AP}=\boldsymbol{P\varLambda}\) ,即 \(\boldsymbol{A}(\boldsymbol{p_1},\boldsymbol{p_2},...,\boldsymbol{p_n})=(\boldsymbol{p_1},\boldsymbol{p_2},...,\boldsymbol{p_n})\begin{pmatrix} \lambda_1\\ & \lambda_2 \\ & & ... \\ & & & \lambda_n \end{pmatrix}\) ,有 \(\boldsymbol{Ap_i}=\lambda_i\boldsymbol{p_i}\) ,亦即 \(\boldsymbol{p_i}\) 就是 \(\boldsymbol{A}\) 的 \(n\) 个特征向量。因此得证。
- 若矩阵 \(\boldsymbol{A}\) 的 \(n\) 个特征值互不相等,则可以相似对角化。
- 对称阵的特征值为实数。
- 若对称阵有两个不相等的特征值,则对应的特征向量正交。
- 对 \(n\) 阶对称阵 \(\boldsymbol{A}\) ,一定有正交阵 \(\boldsymbol{P}\) ,满足 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{P}^{\text{T}}\boldsymbol{AP}=\boldsymbol{\varLambda}\) ,其中 \(\boldsymbol{\varLambda}\) 是以 \(\boldsymbol{A}\) 的 \(n\) 个特征值为对角元的对角阵。(注意课程中这个定理是直接给定的,没有证明)
- 设 \(\boldsymbol{A}\) 为 \(n\) 阶对称阵,\(\lambda\) 是 \(\boldsymbol{A}\) 的特征方程的 \(k\) 重根,则 \(R(\boldsymbol{A}-\lambda\boldsymbol{E})=n-k\) ,从而对应特征值 \(\lambda\) 恰有 \(k\) 个线性无关的特征向量(解集的秩为 \(k\))。
- 矩阵 \(\boldsymbol{A}\) 对角化的步骤:
- 求出矩阵 \(\boldsymbol{A}\) 的所有特征值。
- 对每个特征值求所有基础解系,然后正交化、单位化,总共得到 \(n\) 个两两正交的单位特征向量。
- 按 \(\boldsymbol{\varLambda}\) 中对角元的排列顺序排列,得到 \(\boldsymbol{P}\) 。
- 相似矩阵的性质
- 相似矩阵的特征多项式 \(|\boldsymbol{A}-\lambda\boldsymbol{E}|相同\)。
- 相似矩阵的秩相同(相似变换是一种初等变换)
- 相似矩阵的特征值相同
- \(|\boldsymbol{A}|=|\boldsymbol{B}|=\prod \lambda_i\)
- \(\sum a_{ii}=\sum b_{ii}=\sum \lambda_i\)
例:设 \(\boldsymbol{A}=\begin{pmatrix} 0 & -1 & 1 \\ -1 & 0 & 1 \\ 1 & 1 & 0 \end{pmatrix}\) ,求一个正交阵 \(\boldsymbol{P}\) ,使 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{\varLambda}\) 。
解:\(|\boldsymbol{A}-\lambda\boldsymbol{E}|=0\) ,解得 \(\lambda_1=\lambda_2=1\) ,\(\lambda_3=-2\) 。
取 \(\lambda_1=\lambda_2=1\) ,有方程 \((\boldsymbol{A}-\boldsymbol{E})\boldsymbol{x}=\boldsymbol{0}\) ,\(\boldsymbol{A}-\boldsymbol{E}\overset{\text{row}}{\sim}\begin{pmatrix} -1 & -1 & 1\\ -1 & -1 & 1\\ 1 & 1 & -1 \end{pmatrix}\) \(\overset{\text{row}}{\sim}\begin{pmatrix} -1 & -1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix}\) ,即有 \(x_1=-x_2+x_3\) ,即有解集 \(\boldsymbol{\xi}_1=\begin{pmatrix} -1 \\ 1 \\ 0 \end{pmatrix}\) ,\(\boldsymbol{\xi_2}=\begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix}\) 。
再取 \(\lambda_3=-2\) ,有方程 \((\boldsymbol{A}+2\boldsymbol{E})\boldsymbol{x}=\boldsymbol{0}\) ,\(\boldsymbol{A}+2\boldsymbol{E}\overset{\text{row}}{\sim}\begin{pmatrix} 2 & -1 & 1\\-1 & 2 & 1\\1 & 1 & 2 \end{pmatrix} \overset{\text{row}}{\sim}\) \(\begin{pmatrix} 1 & 0 & 1\\0 & 1 & 1\\0 & 0 & 0 \end{pmatrix}\) ,即有 \(\begin{cases} x_1=-x_3 \\ x_2=-x_3 \end{cases}\) ,即有解集 \(\boldsymbol{\xi_3}=\begin{pmatrix} -1 \\ -1 \\ 1 \end{pmatrix}\) 。
将 \(\boldsymbol{\xi_1}\) 和 \(\boldsymbol{\xi_2}\) 正交化,有 \(\boldsymbol{\xi_2}=\boldsymbol{\xi_2}-\frac{[\boldsymbol{\xi_2},\boldsymbol{\xi_1}]}{[\boldsymbol{\xi_2},\boldsymbol{\xi_2}]}\boldsymbol{\xi_1}=(\frac{1}{2},\frac{1}{2},1)^{\text{T}}\) 。单位化后有 \(\boldsymbol{\xi_1}=\frac{1}{\sqrt{2}}(-1,1,0)^{\text{T}}\) ,\(\boldsymbol{\xi_2}=\frac{1}{\sqrt{6}}(1,1,2)^{\text{T}}\) ,\(\boldsymbol{\xi_3}=\frac{1}{\sqrt{3}}(-1,-1,1)\) ,故有 \(\boldsymbol{P}=(\boldsymbol{\xi_1},\boldsymbol{\xi_2},\boldsymbol{\xi_3})=\begin{pmatrix} -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} & -\frac{1}{\sqrt{3}}\\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} & -\frac{1}{\sqrt{3}}\\ 0 & \frac{2}{\sqrt{6}} & \frac{1}{\sqrt{3}} \end{pmatrix}\) 。
9 二次型
- 含有 \(n\) 个变量 \(x_1,x_2,...,x_n\) 的二次齐次函数
\(f(x_1,x_2,...,x_n)=\)
\(a_{11}x_1^2+a_{12}x_1x_2+...+a_{1n}x_ax_n+\)
\(a_{21}x_2x_1+a_{22}x_2^2+...+a_{2n}x_2x_n+\)
\(...\)
\(a_{n1}x_nx_1+a_{n2}x_nx_2+...+a_{nn}x_n^2\)
称为二次型。 - 二次型 \(f(x_1,x_2,...,x_n)=\)
\((x_1,x_2,...,x_n)\begin{pmatrix} a_{11} & a_{12} & ... & a_{1n}\\ a_{21} & a_{22} & ... & a_{2n}\\ ...\\ a_{n1} & a_{n2} & ... & a_{nn} \end{pmatrix}\) \(\begin{pmatrix} x_1\\x_2\\...\\x_n \end{pmatrix}\) 。
即 \(f(x_1,x_2,...,x_n)=\boldsymbol{x}^{\text{T}}\boldsymbol{A}\boldsymbol{x}\) 。其中 \(\boldsymbol{A}\) 为对称阵。 - 设 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 是 \(n\) 阶矩阵,若有可逆矩阵 \(\boldsymbol{C}\) ,使 \(\boldsymbol{B}=\boldsymbol{C}^{\text{T}}\boldsymbol{AC}\) ,则称矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 合同。对于二次型 \(f=\boldsymbol{x}^{\text{T}}\boldsymbol{A}\boldsymbol{x}\) ,记变换为 \(\boldsymbol{x}=\boldsymbol{Cy}\) ,代入有 \(f=\boldsymbol{y}^{\text{T}}(\boldsymbol{C}^{\text{T}}\boldsymbol{AC})\boldsymbol{y}\) 。也即如果 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 合同,则 \(\boldsymbol{A}\) 对应的二次型就能被变换成 \(\boldsymbol{B}\) 对应的二次型。
- 给定任意二次型 \(f\) ,总有正交变换 \(\boldsymbol{x}=\boldsymbol{Py}\) ,使 \(f\) 化为标准形 \(f=\lambda_1y_1^2+\lambda_2y_2^2+...+\lambda_ny_n^2\) ,其中 \(\lambda_1,\lambda_2,...,\lambda_n\) 是二次型 \(f\) 对应的矩阵的特征值。也即任意二次型对应的矩阵,总是与对角矩阵合同(这个已提出)。
- ((二次形)惯性定理)设有二次型 \(f=\boldsymbol{x}^{\text{T}}\boldsymbol{Ax}\) ,有两个可逆变换 \(\boldsymbol{x}=\boldsymbol{Cy}\) 及 \(\boldsymbol{x}=\boldsymbol{Pz}\) 将二次型变换成标准形 \(f=k_1y_1^2+k_2y_2^2+...+k_ny_n^2\) 和 \(f=\lambda_1z_1^2+\lambda_2z_2^2+...+\lambda_nz_n^2\) ,则 \(k_1,k_2,...,k_n\) 和 \(\lambda_1,\lambda_2,...,\lambda_n\) 中正数的个数相等。正系数的个数称为正惯性指数。负系数的个数称为负惯性指数。
- 设有二次型 \(f=\boldsymbol{x}^{\text{T}}\boldsymbol{Ax}\) ,如果对任何 \(\boldsymbol{x}\ne\boldsymbol{0}\) ,都有 \(f(x)>0\) ,则称 \(f\) 为正定二次型,称对应的 \(\boldsymbol{A}\) 是正定的。否则如果都有 \(f(x)<0\) ,则称 \(f\) 为负定二次型,称对应的 \(\boldsymbol{A}\) 是负定的。
- 二次型 \(f\) 正定 \(\iff\) 其对应的标准形的系数全为正(正惯性指数为 \(n\) ) \(\iff\) 对应对称阵的特征值全为正
附加:思考
- 求正交阵 \(\boldsymbol{P}\) 使对称阵 \(\boldsymbol{A}\) 满足 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{\varLambda}\) 的过程中,依照的是给定的一个定理(对称阵必与特征值对角阵相似)。这个定理描述的是存在性,但是在求对角化变换矩阵的过程中,用的是充分性条件,这合理吗?
分析:
- 二次型变换为标准型,为什么要求是可逆变换?
分析:以 \(f=x_1^2+2x_1x_2+x_2^2=1\) 为例。二次型变换成标准型可以更好地观察原来的图形的性质,例如使 \(\boldsymbol{x}=\begin{pmatrix} 1 & 1\\ 0 & 1 \end{pmatrix}\boldsymbol{y}\) ,则为 \(f=y_1^2=1\) ,显然这代表两条直线。由于可逆变换前后的图形的形状不变(拓扑关系、几何形状)不变,因此原来的图形一定也是两条直线。
posted on 2020-11-15 00:05 amazzzzzing 阅读(781) 评论(0) 收藏 举报
浙公网安备 33010602011771号