矩阵理论

北航《矩阵理论与应用1》的不完全笔记,主攻一些基础概念
笔记主要参考赵迪老师上课内容以及王磊老师的那本教材,如有错误,欢迎指出

特殊矩阵


H 阵

Hermite matrix

定义

  • \(A=A^H \in C^{n\times n}\)

判定

A是Hermite矩阵的充要条件

  • ①存在酉矩阵 \(U\) 使得 \(U^HAU=\Lambda= \mathbf{diag}(\lambda_1,\cdots,\lambda_n)\)

    \(\lambda_1,\cdots,\lambda_n\) 均为实数

  • ②对任意方阵\(S\)\(S^HAS\) 为Hermite矩阵
  • 如果 A , B 是Hermite阵,则\(AB\) 是Hermite矩阵的充要条件是\(AB=BA\)

性质

  • 主对角线元素对角元为实数
    • \(A=\begin{pmatrix}a_{11}&&&*\\&a_{22}&&\\&&\ddots&\\*&&&a_{nn}\end{pmatrix}A^H=\begin{pmatrix}\overline{a_{11}}&&&*\\&\overline{a_{22}}&&\\&&\ddots&\\*&&&\overline{a_{nn}}\end{pmatrix}\)
  • \(A\)\(n\) 个互相正交的特征向量,即 \(X_1\bot X_2\bot...\bot X_n\)

    \(A\) 的不同特征值所对应的特征向量是相互正交的

    • proof
  • \(a_{i,j}=\overline{a_{j,i}}\)

    \(1\leq i,j\leq n\)

  • 任何实对称矩阵是Hermite矩阵
  • 每个\(H\)\(A\) 优相似于对角阵
    • 存在U阵 \(Q\) 使 \(Q^{-1}AQ=Q^HAQ=\Lambda=\begin{pmatrix}\lambda_1&&\\&\ddots&\\&&\lambda_n\end{pmatrix}\\ A=Q\Lambda Q^{-1}=Q\Lambda Q^H\),且 \(\lambda(A)\in R\)
      • proof
  • 特征根都是实数\(\{\lambda_1,\cdots,\lambda_n\}\in R\)
    • proof
  • 对正整数 \(k\)\(A^k\) 也是 \(H\)
  • \(A\) 可逆,\(A^{-1}\) 也是 \(H\)
  • 对实数 \(k , p\)\(k A + p B\) 也是Hermite矩阵

    (A , B为n 阶Hermite矩阵)

  • 任一复方阵都可以唯一地表示成Hermite矩阵和反Hermite矩阵之和

乘积形式的H阵性质

  • 对一切矩阵\(A=A_{n\times p}\)\(n\geq p\)\(A^HA\)\(AA^H\)都是Hermite阵
    • proof
  • \(AA^H\) 矩阵的迹
    • \(A_{n\times p}=\begin{pmatrix}a_{11}&\cdots&a_{1p}\\\vdots&\ddots&\vdots\\a_{n1}&\cdots&a_{np}\end{pmatrix}\in C^{n\times p}\\ A_{p\times n}^H=\begin{pmatrix}\overline{a_{11}}&\cdots&\overline{a_{n1}}\\\vdots&\ddots&\vdots\\\overline{a_{1p}}&\cdots&\overline{a_{np}}\end{pmatrix}\in C^{p\times n}\)
    • \(\displaystyle tr(A^HA)=tr(AA^H)=\sum\limits_{i=1,j=1}^n{|a_{ij}|^2}\)
    • 推论
      • \(tr(AB^H)=tr(B^HA)=\sum a_{ij}\overline{b_{ij}}\)
  • \(A^HA\)\(AA^H\)只相差 \(n-p\) 个 0 根
    • proof
  • \(A^HA\)\(AA^H\)半正定阵
    • proof
  • \(r(AA^H)=r(A^HA)=r(A)=r(A^H)\)
    • proof 1
    • proof 2——只需证\(A^HAX= 0\) 的解也是 \(AX=0\) 的解

二次型、正定阵

参考来源 csdn

Hermite二次型定义

  • \(A^H=A\in \Bbb C^{n\times n}\)\(X=\begin{pmatrix}x_1\\x_2\\\vdots\\v_n \end{pmatrix}\)
  • \(X^HAX=(\overline{x_1},\overline{x_2},\cdots,\overline{x_n}) A\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}\\\)为矩阵 \(A\) 产生的二次型,记作 \(f(x)=X^HAX\)

正定二次型与正定阵定义

  • \(A^H=A\) ,对一切\(X\neq0\) ,有\(X^HAX>0\) ,则\(f(x)=X^HAX\)正定二次型\(A\)正定阵,记为 \(A>0\)
  • \(A^H=A\) ,对一切\(X\neq0\) ,有\(X^HAX\geq0\) ,则\(f(x)=X^HAX\)半正定二次型,A为半正定阵,记为 \(A\geq0\)
  • 补充定义

判定\(n\)阶Hermite矩阵\(A\)正定

  • all

正定阵定理

  • \(A>0\Longleftrightarrow A\)为Hermite阵,且\(\lambda_1,\lambda_2,\cdots,\lambda_n>0\)
    • proof
  • \(A\geq0\iff A\)为Hermite阵,且\(\lambda_1,\lambda_2,\cdots,\lambda_n\geq0\)
  • 单位阵是正定阵
  • 正定阵间必合同
    • \(A >0 \iff A \triangleq \Lambda\)
    • \(\Lambda \triangleq I\)
    • \(A,B\) 为同阶正定阵,则 \(A \triangleq B\)
    • proof

补充

  • 实正定阵的重要结论

斜H阵

Skew-Hermit

  • \(A^H=-A\)
  • 性质
    • 对角元为纯虚数
    • \(B\) 是 skew-Hermit \(\rightarrow\) \(iB\)\(\displaystyle \frac{B}{i}\) 都是Hermit
    • \(A\) 是 Hermit \(\rightarrow\) \(iA\)\(\displaystyle \frac{A}{i}\) 都是Skew-Hermit
    • \(A\) 是 Hermit \(\Leftrightarrow\) \(iA\) 是 Skew-Hermit

正交阵

  • \(A^TA=AA^T=I\)
  • 性质
    • 正交矩阵的任一行(列)同时乘以−1时,得到的新矩阵仍为正交矩阵
    • 正交阵的所有特征值的模值为1
    • 正交阵的行列式必为 \(\pm1\)
    • 正交阵的乘积仍为正交阵
  • 判定
    • 定义法 \(A^TA=AA^T=I\)
    • \(n\)阶实方阵\(A\)是正交矩阵当且仅当
      • \(A\)所有特征值的模值为\(1\)
      • 且存在酉矩阵\(U\)使得 \(U^HAU=diag(λ_1,⋯,λ_n)\)

        其中\(λ_1,⋯,λ_n\)是A的n个特征值


优阵(U阵)

  • 如果 \(A=(\alpha_1,\alpha_2,\cdots,\alpha_n)_{n\times n}\)预优阵\(|\alpha_1|=|\alpha_2|=\cdots=|\alpha_p|=1\),那么\(A\) 是一个优阵
  • 判定
    • \(A=(\alpha_1,\alpha_2,\cdots,\alpha_n)_{n\times n}\)是U阵 \(\iff\)
      • \(|\alpha_1|=|\alpha_2|=\cdots=|\alpha_p|=1\)
      • \(\alpha_1\perp\alpha_2\perp\cdots\perp\alpha_n\)
    • \(A=A^{n\times n} 是 U阵 \\ \Leftrightarrow A^{H} A=I_{\mathrm{n}} \\ \Leftrightarrow A^{-1}=A^{H} \\ \Leftrightarrow AA^{H}=I_{\mathrm{n}}\)

      \(\because AA^{-1}=I\)

      • 注意:U阵必可逆
    • \(n\)阶复方阵\(A\)是U阵当且仅当
      • \(A\)所有特征值的模值为\(1\)
      • 且存在酉矩阵\(U\)使得 \(U^HAU=diag(λ_1,⋯,λ_n)\)

        其中\(λ_1,⋯,λ_n\)是A的n个特征值

  • 性质

    如果 A 是U阵

    • 如果 \(A_{n,n}和B_{n,n}\) 是U阵 \(\Rightarrow\) \(AB\)是U阵
    • \(A 是U,且X_1\bot X_2\cdots\bot X_p \Rightarrow\) \(AX_1\bot AX_2\cdots\bot AX_p\)
    • \(k=\pm1,kA=(k\alpha_1,k\alpha_2,\cdots,k\alpha_n)\text{ 为优阵}\)
    • \(B=(\beta_1,\beta_2,\cdots,\beta_n)\)为优阵,其中\(\beta\text{ 组为 }\alpha\text{ 组的重排}\)
    • \(|Ax|^2=|x|^2\)
    • \(x\bot y\Rightarrow Ax\bot Ay\)
    • \((Ax,Ay)=(x,y)\)
  • 拓展性质
    • U阵的任一行(列)同时乘以模为1的任何数后,得到的新矩阵仍为U阵
    • U阵的乘积仍为U阵
    • \(A\) 所有特征值的模值为1,行列式的模值为1

正规阵

  • 方阵 \(A\) 满足 \(A^HA=AA^H\)

    正规阵必为方阵

  • 判定
    • H 阵 斜H阵正交阵、(包含实正交阵)都是正规阵
    • 对角阵一定是正规阵
    • 严格三角阵(非对角形)一定不是正规阵
    • 实对称实反对称阵都正规
    • 复方阵 \(A\) 是正规矩阵 当且仅当 \(A\)\(n\)特征向量构成\(\Bbb C^n\) 空间的一组标准正交基,且属于 \(A\)不同特征值的特征向量正交
    • 复方阵 \(A\) 是正规矩阵 当且仅当 \(A\) 酉相似于对角阵
    • \(n\)阶方阵\(A\)正规的充分必要条件是它与一个具有互异的特征值且与\(A\)有相同的特征向量的矩阵\(B\)可交换(即\(AB=BA\))
    • 若两个正规矩阵可交换,则它们的乘积也是正规矩阵
      • proof
  • 性质
    • \(A\)正规,则\(kA+cI\)正规
    • \(A\)正规,则\(A\)\(A^H\)必有相同特征向量
      • 即若\(A\)正规,且\(AX=cX\),则\(A^HX=\bar{c}X\)
    • \(A\)正规,则\(Q^HAQ\)也正规,其中\(Q\)为U阵(\(QQ^H=I\)

      正规阵的优相似必正规

    • \(A\)正规,则任意多项式\(f(A)=λ_ 0 I+λ _1 A+λ _2 A ^2 +⋯+λ_nA^K\)也正规

      多项正规定理——正规阵的多项式也正规

    • 正规阵的奇异值为特征值的绝对值
  • 易错
    • × 若A是正规矩阵,则A的特征向量必两两正交
  • 引理
    • \(\text{若分块阵 }A=\begin{pmatrix}B&C\\0&D\end{pmatrix}\text{正规,则 }C=0\text{,且 }B,D\text{ 都正规,即 }A=\begin{pmatrix}B&0\\0&D\end{pmatrix}\)

度量矩阵

Gram Martrix

  • 定义
    • \(ϵ_1,⋯,ϵ_n\)是内积空间 \(V\) 中的一组基,称n阶矩阵A 为\(V\) 关于基 \(ϵ_1,⋯,ϵ_n\) 的度量矩阵
    • 记为 \(G(ϵ_1,⋯,ϵ_n)\)
  • tips
    • 内积空间中内积与度量矩阵是一一对应的
    • \((x,y)=η^HA^Hξ\)
      • \(ϵ_1,⋯,ϵ_n\) 是内积空间V的一组基,则 \(∀x,y∈V\),有
  • 性质

    \(G(ε_1,⋯,ε_n)\)\(G(ϵ_1,⋯,ϵ_n)\) 均为内积空间 \(V\) 的度量矩阵

    • \(G(ε_1,⋯,ε_n)\)\(G(ϵ_1,⋯,ϵ_n)\)正定Hermite矩阵
    • \(G(ε_1,⋯,ε_n)\)\(G(ϵ_1,⋯,ϵ_n)\) 合同
      • 即存在非奇异矩阵(可逆矩阵) \(P\) 使得
      • \(P^HG(ε_1,⋯,ε_n)P=G(ϵ_1,⋯,ϵ_n)\)
      • \(P\) 是由基 \(ε_1,⋯,ε_n\) 到基\(ϵ_1,⋯,ϵ_n\) 的过渡矩阵

Householder矩阵

  • 定义
    • \(w∈ℂ^n\)单位向量
    • \(H(w)=I−2ww^H\)
  • 性质
    • \(\big(H(w)\big)^H=H(w)=\big(H(w)\big)^{−1}\)
    • \(|H(w)|=−1\)

      特征值 n-1个1, 1个 -1

    • \(x, y∈ℂ^n\)\(x≠y\),则存在单位向量 \(w\) 使得\(H(w)x=y\)充分必要条件
      • \(x^Hx=y^Hy\quad,x^Hy=y^Hx\)
      • 此时可取 \(\displaystyle w=\frac{e^{iθ}(x−y)}{‖x−y‖}\)

        其中θ为任一实数,实际求就取0

    • 一定可以酉相似对角化

奇异矩阵

  • \(|A|=0\)
  • 没有逆矩阵

λ矩阵

定义

  • λ多项式 为元素的矩阵称为\(\lambda\)矩阵,记为A(λ)
    • \(A(λ)=[a_{ij}(λ)]_{m×n}\)

      \(a_{ij}(λ)∈P_n(λ)\)

λ矩阵的秩

  • 矩阵\(A(λ)\)非零子式的最高阶数r 定义为\(A(λ)\)的秩,记为rank(A(λ))=r
  • 例子

λ矩阵相抵

  • 定义
    • \(\lambda\)矩阵\(A(\lambda)\)经过有限次初等变换化为\(B(\lambda)\),则称\(A(\lambda)\)\(B(\lambda)\)相抵
      • \(\lambda\)矩阵的初等变换
    • 即存在可逆阵 \(P(\lambda)\)\(Q(\lambda)\),使得 \(A(\lambda ) = P(\lambda)B(\lambda)Q(\lambda)\)
    • \(A(λ)≅B(λ)\)
  • 判定
    • \(\lambda\)矩阵\(A(\lambda)\)\(B(\lambda)\)相抵 的充要条件
      • or 完全一致的不变因子
        • 即Smith标准型相同
      • or 具有相同的各阶行列式因子
        • 行列式因子

          注意:行列式因子的个数=\(\lambda\)矩阵的秩!

          • \(\lambda\) 矩阵 \(A(\lambda)\) 的秩为 \(r\),对于正整数 \(1\le k\le r\)\(A(\lambda)\) 的全部 \(k\) 阶子式的首1最大公因式称为 \(k\) 阶行列式因子,记作\(D_k(\lambda)\)
          • 例子
      • or 完全一致的初等因子,且 \(rank\big (A(λ)\big)=rank\big(B(λ)\big)\)
  • 性质
    • \(\lambda\)矩阵相抵则其秩相同,反之则不然
    • 相抵的\(\lambda\)矩阵具有相同的秩相同的各阶行列式因子
    • 复方阵A和B相似当且仅当它们的特征矩阵相抵
      • 相似与相抵之间的关系
  • 例子

λ矩阵的逆矩阵

  • 定义
    • \(A(λ)\)\(n\)\(λ\) 方阵,若存在 \(n\)\(λ\)方阵\(B(λ)\)满足\(A(λ)B(λ)=B(λ)A(λ)=I\) 则称λ矩阵A(λ)是可逆的,并称B(λ)为A(λ)的逆矩阵,记作\(A(λ)^{−1}\)
  • 判定
    • \(\lambda\)方阵\(A(\lambda)\)可逆充分必要条件是其行列式\(|A(λ)|\)为非零常数

Smith标准形

  • 定义
    • \(λ\) 矩阵 \(A(\lambda)\) 的秩为 \(r\)
    • 此标准形为\(A(\lambda)\)的Smith标准形
    • \(d_i(λ)\)首1多项式,且 \(d_i(λ)|d_{i+1}(λ)\)
  • tips
    • \(A(\lambda)\)不一定是方阵,故Smith标准形不一定是对角阵
    • Smith标准形中不变因子行列式因子之间的关系
      • 重要
    • \(\lambda\)矩阵的Smith标准形是唯一
  • Frobenious定理
    • \(A∈ℂ^{n×n}\)
    • 其特征矩阵 \(λI−A\) 的Smith标准形为 \(\rm diag(d_1(λ),…,d_n(λ))\)
    • \(A\)最小多项式\(m_A(λ)=d_n(λ)\)
    • \(\lambda I−A\)初等因子的最小公倍式即为矩阵\(A\)的最小多项式\(m_A(\lambda)\)
  • 例子
    • 求Smith标准型

    • 求初等因子、不变因子、Smith标准型

不变因子

  • 定义
    • \(\lambda\) 矩阵\(A(\lambda)\)的Smith标准形中
    • \(d_1(λ),⋯,d_{r}(λ)\)\(A(\lambda)\)唯一确定的,称为\(A(\lambda)\)不变因子
  • tips
    • 初等变换不改变\(\lambda\)矩阵的不变因子
  • 例子

初等因子

  • 定义
  • 例子
    • 注:初等因子组可能存在相同的因子
  • tips
    • 初等变换不改变\(A(\lambda)\)的初等因子
    • \(\lambda\)矩阵\(A(\lambda)\)为对角块矩阵

      \(A(λ)=diag(A_1(λ),⋯,A_s(λ))\)

      • \(A_1(λ),⋯,A_s(λ)\) 初等因子的全体就是\(A(λ)\) 的全部初等因子
    • 行列式\(|\lambda I-A|\) 等于全体初等因子的乘积

tips

  • 数字矩阵是特殊的\(\lambda\)矩阵
  • 复方阵A的特征矩阵 \(λI−A\)\(\lambda\)矩阵
    • \(λI−A\) 总是满秩的
    • 行列式\(|\lambda I-A|\) 等于全体初等因子的乘积
    • 行列式\(|\lambda I-A|\) 等于n阶行列式因子
  • λ方阵\(A(λ)\)可逆充分必要条件是其行列式\(|A(λ)|\)为非零常数
  • 在求λ矩阵的Smith标准形、不变因子或初等因子时
    • 可先将λ矩阵作初等变换,使得变换后的矩阵为对角(块)矩阵
    • 利用定理求出λ矩阵的初等因子,进而求出Smith标准形和不变因子

单纯阵

  • 定义
    • 1
    • 2
  • 性质
    • 方阵A是单纯矩阵的充分必要条件
      • or \(A\)的特征矩阵 \(λI−A\)初等因子一次
      • or \(A\)的特征矩阵 \(λI−A\)不变因子无重根
    • 充分条件
      • 若复方阵A的零化多项式 \(g(λ)\) 无重根\(\Rightarrow\)则矩阵A是单纯矩阵
      • 若复方阵是幂等阵,则一定可以对角化

幂零阵、幂等阵

幂零阵

  • 定义
    • \(A^k=0\)\(A \in \Bbb C^{n\times n}\)
  • 性质
    • A的全体特征根为0
    • \(|A+I| =1\)
      • proof

幂等阵

也称 \(A\) 为 投影矩阵

  • 定义
    • \(A∈ℂ^{n×n}\)
    • \(A^2=A\)
  • 性质

    \(A\in \Bbb C^{n\times n}_r\) 为幂等阵

    • \(A^H\)\(A^∗\)\(I−A\)都是幂等矩阵
    • A 为单纯阵相似于对角阵\(\Lambda = \begin{bmatrix} I_r & 0 \\ 0 & 0 \end{bmatrix}\)
    • \(\rm tr(A)=rank(A)\)
      • 幂等阵的特征值只能是或者0或1,\(r\)个1,\(n-r\)个0
      • proof
    • \(N(A)=R(I-A)\)

      充要条件

    • \(\mathbb C^n=N(A) \dot{+}R(A)\)
    • \(\mathbb C^n=N(A) \dot{+} N(A-I)\)
    • \(Ax=x\) \(\iff\) \(x∈R(A)\)

      其中 \(x\in \Bbb C^n\)

      • proof
    • \(\displaystyle \rm e^{tA}=I+(e^t-1)A\)
  • 做题技巧
    • \(A,B,A-B\)均为投影矩阵,则\(AB=BA=B\)
      • proof 由\(A^2=A,B^2=B,(A-B)^2=A-B\\ \Rightarrow 2B =AB+BA\\ \Rightarrow2AB=AB+ABA,2BA=ABA+BA\\ \Rightarrow AB=BA=B\)

秩一矩阵

  • \(A=\alpha \beta^T\)\(\rm rank(A)=1\)
  • 性质

    \(A\)\(n\) 阶 秩一矩阵

    • \(A\)\(n\) 个特征值是 1,1 个特征值为\(\rm tr(A)\)
    • \(\rm tr(A) = \beta^T\alpha\)
    • \(\rm tr(A) \neq0\) 时, \(A\) 可以相似对角化
    • \(\rm A^k = tr(A)^{k-1} A\)
    • \(\alpha\)\(A\)\(\rm tr(A)\) 特征值对应的的特征向量
    • \(|\lambda I-A| = \lambda^{n-1}[\lambda-tr(A)]\)
    • \(m_{\lambda}(A) = \lambda [\lambda-tr(A)]\)
    • \(A\) 的非零奇异值为 \(\|\alpha\|_2 \|\beta\|_2\)
    • \(\|A\|_2 = \|\alpha\|_2 \|\beta\|_2\)

      矩阵的2范数即为最大奇异值

    • \(\|A\|_F = \|\alpha\|_2 \|\beta\|_2\)
    • \(B\)是秩为\(m\)的单纯矩阵,则\(B\)必可写成\(m\)个秩一矩阵之和

重要概念


共轭Conjugate

  • 复数 \(w=a+ib\)
    • \(\overline{w}=\overline{a+bi}=a-bi\)
  • 矩阵的共轭——矩阵内每个元素取共轭
    • \(\overline{A}=(\overline{a_{i,j}})\)
  • 性质
    • 实矩阵
      • \(\overline{A}=(\overline{a_{i,j}})=(a_{i,j})=A\)
    • \(\text{对于任意 } A=A_{m\times n}\in\mathbb{C}^{m,n}, B=B_{m\times p}\in\mathbb{C}^{n,p}\)
      • \(\overline{(AB)}=(\overline{A})(\overline{B})\quad\)

共轭转置=转置共轭

  • \(A^H=\overline{A}^T=\overline{A^T}\)
  • 性质
    • \({(A^H)}^H=A\)
    • \((A+B)^H=A^H+B^H\)
    • \((kA)^H=\overline{k}(A^H)\)

      \(k\in C\) (复数)

    • \((ABC)^H=C^HB^HA^H\)
    • \(\displaystyle (e^A)^H=e^{A^H}\)

矩阵的模/范数

  • \(||A||=\sqrt{\sum|a_{i,j}|^{2}}\)

向量的模

  • \(|| X||=\sqrt{(X,X)}=\sqrt{\left|x_1\right|^2+\left|x_2\right|^2+\cdots+\left|x_n\right|^2}\geq0\)
  • 性质

    \(∀x,y∈V\)\(k∈F\)



参考来源

  • \(tr(A)=a_{11}+\ldots+a_{nn}\)
  • tips
    • \(\rm tr(ABC)=tr(BCA)=tr(CAB)\)
      • proof
    • \(\rm tr(kA)=k\cdot tr(A)\)
    • \(\rm tr(A+B)=tr(A)+tr(B)\)
    • \(\displaystyle \frac {\partial tr(AB)}{\partial A}=\frac {\partial tr(BA)}{\partial A}=B^T\)

      矩阵乘积的迹关于第一个矩阵的梯度等于第二个矩阵的转置

      • proof
    • \(\displaystyle \frac {\partial tr(A^TB)}{\partial A}=\frac {\partial tr(BA^T)}{\partial A}=B\)
    • \(\rm tr(A) =\sum_i\lambda_i\)

      矩阵的迹为所有特征值之和

    • \(\rm tr(A)=tr(A^T)\)

模平方公式

  • \(tr(A^{H}A)=tr(AA^H)=\sum|a_{i,j}|^{2}={||A||}_F^2\)
    • \(\begin{aligned}tr(AA^{H})&=tr[(A^{H})^{H}A^{H}]\\&=||A^{H}||^{2}\\&=\sum|\overline{a_{ij}}|^{2}\\&=||A||_F^{2}\end{aligned}\)
  • 推导前提——列向量的模平方公式
    • 对于一个列向量\(X\)—— \(X^HX={\|X\|}^2\)
    • \(\mathrm{tr}(X^HX)=\mathrm{tr}(XX^H)=\left|x_1\right|^2+\left|x_2\right|^2+\cdots+\left|x_n\right|^2=\sum\left|x_j\right|^2\overset{\text{记为}}{\operatorname*{=}}|\mathbf{X}|^2\)
  • 推广公式
    • 已知 \(A=(a_{ij})_{m\times n}、B=(b_{ij})_{m\times n} \in \Bbb C^{m\times n}\)
      • \(tr(AB^H)=tr(B^HA)=\sum a_{ij}\overline{b_{ij}}\)
      • \(tr(AB^T)=tr(B^TA)=\sum a_{i,j}b_{i,j}\)
      • \(\mathrm{tr}(XY^{H})=\mathrm{tr}(Y^{H}X)=Y^{H}X=x_{1}\overline{y}_{1}+\cdots+x_{n}\overline{y}_{n}\)

        \(\mathrm{~for~}X,Y\in\mathbb{C}^{\mathrm{n}}\)


全体特征根

  • \(\lambda(A)=\{\lambda_1,\ldots,\lambda_n\}\)

特征值

特征子空间

  • \(\lambda\)是矩阵\(A\in \Bbb C^{n\times n}\)的一个特征值
  • \(E(\lambda )=\{x∈\Bbb C^n|Ax=\lambda x\}\)
  • \(E(\lambda )\)\(\Bbb C^n\)线性子空间,称为属于特征值\(\lambda\)特征子空间
  • \(\rm dim E(λ_i)=n−rank(\lambda_i I−A)\)为特征值\(\lambda_i\)几何重数
    • 代数重数
    • 矩阵\(A\)的特征值\(λ_i\)作为特征方程根的重数,称为特征值\(\lambda_i\)代数重数
    • !!! 几何重数\(\leq\)代数重数
      • 复方阵某一特征值的代数重数为1,则它的几何重数必为1
      • 示例
  • \(\rm dim(E(\lambda))\ge1\)

右逆、左逆

  • A有右逆 的充要条件(即存在矩阵B使得\(AB= I\)
    • A为行满秩矩阵
  • A有左逆 的充要条件(即存在矩阵B使得\(BA= I\)
    • A为列满秩矩阵

内积Inner product

定义在\(\Bbb C^n\)(列) 上的内积

\(X\)\(Y\) 都是 \(C^n\) 上的列向量

  • \(X\)\(Y\)的标准内积
    • \((X,Y)=Y^HX=\mathrm{tr}(XY^H)=x_1 \overline{y_1}+\cdots+x_n \overline{y_n}\)

      \(X=\begin{pmatrix}x_{1}\\\vdots\\x_{n}\end{pmatrix}, Y=\begin{pmatrix}y_{1}\\\vdots\\y_{n}\end{pmatrix}\in\mathbf{C}^{n}\)

    • \(YX^H=(Y,X)=\overline{(X,Y)}\)
  • 特例
    • \((X,X)=\mathrm{tr}(XX^H)=X^HX=x_1\overline{x_1}+\cdots+x_n\overline{x_n}=\mid x_1\mid^2+\cdots+\mid x_n\mid^2=\mid X\mid^2\)
  • 特性
    • \(\mid X\mid^2=(X,X)=\mathrm{tr}(XX^H)=\mathrm{tr}(X^HX)=X^HX=\mid X\mid^2\)
    • \(Y^HX=(X,Y) \\\) \(X^HY=(Y,X)=\overline{(X,Y)}\)
    • \(\mid kX\mid=\mid k\parallel X\mid\\ \mid\frac{X}{k}\mid=\frac{\mid X\mid}{\mid k\mid},(k\neq0);\quad\\ \mid X\pm Y\mid\leq\mid X\mid+\mid Y\mid.\)

      模长性质

    • 如果 \(X \ne 0\)\(\frac{X}{|X|}\) 是单位向量

      单位化公式

  • 内积性质
    • \((X,X)\ge 0\)
    • \((Y,X)=\overline{(X,Y)}\)
    • \((kX,Y)=k(X,Y)\\ (X,kY)=\overline{k}(X,Y)\)

      \(k\in C\)

    • \((X+Y,W)=(X,W)+(Y,W),\\(W,X+Y)=(W,X)+(W,Y)\)
    • \(| (X,Y) |^{2}\leq(X,X)(Y,Y)\\ \mathrm{i.e.} | (X,Y) |\leq| X |\cdot| Y|\)

定义在\(\Bbb C^{m\times n}\)(复矩阵空间)上的内积

  • 定义
    • \(\begin{aligned}(A,B)&\triangleq tr(B^HA)=tr(AB^H)=\sum a_{ij}\overline{b_{ij}} ,A,B\in C^{m,n}\\(A,A)&\triangleq tr(A^HA)=tr(AA^H)=\sum a_{ij}\overline{a_{ij}} =\sum|a_{ij} |^2\end{aligned}\)
  • 特性
    • \((A,A)=tr(AA^H)=\sum\Bigl|a_{ij}\Bigr|^2\geq0\)
    • \((B,A)=\overline{(A,B)}\)
    • \((kA,B)=k(A,B)\)
    • \((A,kB)=\overline{k}(A,B), k\in\mathbb{C}\)
    • \((A+B,D)=(A,D)+(B,D)\)
    • \((D,A+B)=(D,A)+(D,B)\)
  • 性质
    • \(|(A,B)|^2\le(A,A)(B,B),\text{即}|(A,B)|\le\|A\|\cdot\|B\|\)
  • 内积形式(列分块)
    • \(\begin{aligned}A&=\begin{pmatrix}a_{11}&\cdots&a_{1p}\\\vdots&\ddots&\vdots\\a_{n1}&\cdots&a_{np}\end{pmatrix}\in C^{n\times p}\\&=(\alpha_1,\cdots,\alpha_p),\text{其中}\alpha_i\text{为}n\text{维列向量}(n\times1\text{阶矩阵})\end{aligned}\)
    • \(\begin{aligned}A^{H}& =\begin{pmatrix}\overline{a_{11}}&&\cdots&&\overline{a_{n1}}\\\vdots&&\ddots&&\vdots\\\overline{a_{1p}}&&\cdots&&\overline{a_{np}}\end{pmatrix} \in C^{p\times n} \\&=\begin{pmatrix}\overline{\alpha_1}^T\\\vdots\\\overline{\alpha_p}^T\end{pmatrix}\text{,其中}\overline{\alpha_1}^T\text{是}n\text{维行向量}1\times n\text{阶矩阵}\end{aligned}\)
    • \(\begin{aligned}A^{H}A& =\begin{pmatrix}\overline{\alpha_1}^T\\\vdots\\\overline{\alpha_p}^T\end{pmatrix}(\alpha_1,\cdots,\alpha_p) \\&=\begin{pmatrix}\overline{\alpha_1}^T\alpha_1&&\overline{\alpha_1}^T\alpha_2&&\cdots&\overline{\alpha_1}^T\alpha_p\\\overline{\alpha_2}^T\alpha_1&&\overline{\alpha_2}^T\alpha_2&&\cdots&\overline{\alpha_2}^T\alpha_p\\\vdots&&\vdots&&\ddots&\vdots\\\overline{\alpha_p}^T\alpha_1&&\overline{\alpha_p}^T\alpha_2&&\cdots&\overline{\alpha_p}^T\alpha_p\end{pmatrix} \\&=\begin{pmatrix}(\alpha_1,\alpha_1)&&(\alpha_2,\alpha_1)&&\cdots&&(\alpha_p,\alpha_1)\\(\alpha_1,\alpha_2)&&(\alpha_2,\alpha_2)&&\cdots&&(\alpha_p,\alpha_2)\\\vdots&&\vdots&&\ddots&&\vdots\\(\alpha_1,\alpha_p)&&(\alpha_2,\alpha_p)&&\cdots&&(\alpha_p,\alpha_p)\end{pmatrix} \\&=\begin{pmatrix}\overline{(\alpha_1,\alpha_1)}&&\overline{(\alpha_1,\alpha_2)}&&\cdots&&\overline{(\alpha_1,\alpha_p)}\\\overline{(\alpha_2,\alpha_1)}&&\overline{(\alpha_2,\alpha_2)}&&\cdots&&\overline{(\alpha_2,\alpha_p)}\\\vdots&&\vdots&&\ddots&&\vdots\\\overline{(\alpha_p,\alpha_1)}&&\frac{\vdots}{(\alpha_p,\alpha_2)}&&\cdots&&\overline{(\alpha_p,\alpha_p)}\end{pmatrix} \\&==\begin{pmatrix}|\alpha_1|^2&\overline{(\alpha_1,\alpha_2)}&\cdots&\overline{(\alpha_1,\alpha_p)}\\\overline{(\alpha_2,\alpha_1)}&|\alpha_2|^2&\cdots&\overline{(\alpha_2,\alpha_p)}\\\vdots&\vdots&\ddots&\vdots\\\overline{(\alpha_p,\alpha_1)}&\overline{(\alpha_p,\alpha_2)}&\cdots&|\alpha_\text{p}|^2\end{pmatrix}\end{aligned}\)

正交orthogonal

定义

  • \(\begin{aligned}X\bot Y\iff(X,Y)=0& =x_1\overline{y_1} +x_2\overline{y_2} +\cdots+x_n\overline{y_n} \\&=\overline{\overline{x_1}\left.y_1\right.+\overline{x_2}\left.y_2\right.+\cdots+\overline{x_n}\left.y_n\right.} \\=(Y,X)\end{aligned}\)

    \(X=\begin{pmatrix}x_{1}\\\vdots\\x_{n}\end{pmatrix}, Y=\begin{pmatrix}y_{1}\\\vdots\\y_{n}\end{pmatrix}\in\mathbf{C}^{n}\)

性质

  • \(X\perp Y\iff\big(Y,X\big)=\overline{(X,Y)}=y_1\overline{x_1}+y_2\overline{x_2}+\cdots+y_n\overline{x_n}=0.\)
  • \(X\perp Y\iff(Y,X)=0\iff(X,Y)=0\)
  • \(X\perp Y\iff\mathrm{X}^HY=0\iff Y^HX=0\)

    \(\mathrm{X}^{H}Y=(Y,X)=\overline{(X,Y)},\quad Y^{H}X=(X,Y)\)

  • \(X\bot Y\Rightarrow aX\bot bY\)

    \((aX,bY)=\overline{b}Y^HaX=a\overline{b}Y^HX=a\overline{b}(X,Y)=0\)

  • \(X_1\perp X_2\perp\cdots\perp X_n \\ \Rightarrow|c_1X_1\pm c_2X_2 \pm\cdots\pm c_nX_n|^2 =|c_1X_1|^2+ |c_2X_2|^2+\cdots+|c_nX_n|^2\)

    此时\(X_1,X_2,\cdots,X_n\)称为一个正交组

tips

  • 零向量θ与任何向量均正交
  • 正交向量组要求向量均为非零向量
  • 正交向量组线性无关
  • 向量 \(X\)\(Y\) 正交当且仅当 \(‖X+Y‖^2=‖X‖^2+‖Y‖^2\)

    勾股定理

  • \(n\) 维内积空间中,正交向量组中的向量个数不会超过n个
  • 拓展

矩阵合同

  • \(P^HAP=B(P可逆)\),则\(A\)\(B\) 合同,记为 \(A\triangleq B\)

基本性质

  • 对 称 性 : \(A\triangleq B\Longleftrightarrow B\triangleq A\)
  • 传 递 性 : \(A\triangleq B, B\triangleq C\Longleftrightarrow A\triangleq C\)

矩阵相似

  • 定义
  • tips
    • 两矩阵相似的充分必要条件是两矩阵的特征矩阵相抵

矩阵的秩

  • 矩阵秩越乘越小:\(r(AB)<\rm min\{r(A),r(B)\}\)
  • \(\rm r(A)=r(AB)\) 成立的充要条件是存在适当阶数的矩阵\(C\)使得\(ABC=A\)
  • 一般的,若\(\rm (A-xI)(A-yI)=0\),则 \(A\) 可以对角化
    • 例子 proof
  • 对于任意 \(n\) 阶矩阵 \(A\)\(\rm rank(A^n)=rank(A^{n+1})\)
  • 补充性质
    • 一些结论

零化多项式

定义

  • 给定矩阵\(A∈ℂ^{n×n}\)
  • 若存在多项式\(g(λ)\)使得\(g(A)=0\)
  • 则称\(g(λ)\)\(A\)的零化多项式

性质

  • 复方阵A的零化多项式有无数个,A阵特征多项式的所有倍式都是A阵的零化多项式

首1多项式

  • 对于一元多项式 \(g(λ)=a_nλ^n+a_{n−1}λ^n−1+⋯+a_1λ+a_0\)
  • 如果 \(a_n≠0\),则称 \(a_nλ^n\)为多项式的首项
  • \(n\) 称为 \(g(λ)\) 的次数,记为 \(deg\big(g(λ)\big)=n\)
  • \(a_n\) 称为 \(g(λ)\) 的首项系数
  • \(a_n=1\),则称 \(g(λ)\)首1多项式

最小多项式

定义

  • 复方阵 \(A\) 的零化多项式中最小次数的首1多项式称为矩阵A的最小多项式
  • \(m_A(λ)\)

性质

  • 矩阵A的最小多项式\(m_A(λ)\)是唯一的,且可整除矩阵A的任一零化多项式
    • 特别的 \(m_A(λ) | f_A(λ)\)
  • 矩阵A的特征多项式\(f_A(λ)\)与最小多项式\(m_A(λ)\)具有相同的根(不计重数)
    • 矩阵A的最小多项式\(m_A(λ)\)必为特征多项式\(f_A(λ)\)的因式
    • 例子

求法

  • 利用Smith标准型求
  • 利用特征多项式与定义求
  • 利用Jordan标准型求

Jordan块

参考

定义

  • Jordan块
  • Jordan标准形
    • 例子
  • Jordan标准形定理
    • 设矩阵\(J\)是复方阵\(A\)的Jordan标准形,则矩阵\(A\)与矩阵\(J\)相似
    • 例子
      • 题目
      • 解答

性质

  • 任一Jordan块的最小多项式等于它的特征多项式,也是Jordan块所对应特征矩阵的初等因子
    • 给定初等因子所作的最简\(\lambda\)矩阵就是Jordan块的特征矩阵
  • Jordan块本身就是一个Jordan矩阵
  • 对角阵是一个Jordan矩阵,它的每个Jordan块都是一阶的 \(\Leftrightarrow\) A 的初等因子都是一次的
  • Jordan标准型中,不同Jordan块的对角线元素可能相同,故特征值\(\lambda_i\)的代数重数 \(\ge\) \(\lambda_i\) 对应的某个Jordan块的阶数
  • 矩阵不一定可以相似对角化,但一定可以与Jordan矩阵相似

Jordan标准型求法

  • ① 特征向量法
    • 如果 \(\lambda_i\)\(A\) 的单重特征值,则 \(\lambda_i\) 对应一阶Jordan块\(\rm J_1(\lambda_i)\)
    • 如果 \(\lambda_i\)\(A\)\(r_i\) 重特征值(代数重数),设 \(\rm s_i=dim(E_{\lambda_i})\)

      $E $ 指特征子空间\(\rm dimE_{\lambda_i} = n-rank(A-\lambda_iI)\)等于\(\lambda_i\) 的几何重数

      • 对应 \(\lambda_i\) \(\rm s_i\) \(\lambda_i\)为对角元的Jordan块
      • 且这些Jordan块的阶数之和等于 \(r_i\)
    • \(A\)的所有相异特征值对应的Jordan块构成的Jordan矩阵即为\(A\)的Jordan标准型
    • 例子
  • ② 初等变换法
    • 方法一
      • 通过对\(\lambda I-A\)进行\(\lambda\)矩阵的初等变换得到Smith标准型
      • 从而得到不变因子\(\Rightarrow\)初等因子\(\Rightarrow\)Jordan块
    • 方法二
      • \(\lambda I-A\)进行初等变换变成对角块矩阵
      • 直接得到初等因子,从而得到Jordan块
  • ③行列式因子法
    • 通过定义求\(\lambda I-A\)行列式因子
    • 从而得到\(\Rightarrow\)不变因子\(\Rightarrow\)初等因子\(\Rightarrow\)Jordan块

Jordan分解方法

  • 例子

Jordan标准型的幂

Jordan标准型求矩阵函数

  • \(f(A) = P f(J)P^{-1}\)

tips

  • 利用Jordan标准型求矩阵最小多项式的方法
    • 单 Jordan 块情况
      • \(J\) 仅包含一个 Jordan 块 \(J_1\) 时,\(J_1\)的最小多项式 \(\rm m_{J_1}(\lambda)=(\lambda-\lambda_1)^{k_1}\)
        • \(\lambda_1\)是 Jordan 块 \(J_1\) 的特征值
        • \(k_1\)是 Jordan 块 \(J_1\) 的阶数
    • 当 J 包含两个 Jordan 块 \(J_1\)\(J_2\)
      • 矩阵 \(J\) 的最小多项式为\(\rm m_{J_1}(\lambda)=(\lambda-\lambda_1)^{k_1}\)\(\rm m_{J_2}(\lambda)=(\lambda-\lambda_2)^{k_2}\)最小公倍数
    • 一般的Jordan标准型 \(J\)
      • J 的最小多项式等于特征矩阵 \(\rm \lambda I-A\) 的初等因子的最小公倍数,恰为不变因子\(\rm d_n(\lambda)\)
    • 例子
  • 引理

映射、变换

  • \(V\)\(W\) 是两个非空集合,\(f\)\(V\)\(W\) 的一个映射

单射

  • 对任意 \(x_1,x_2∈V\), 当 \(x_1≠x_2\) 时有 \(f(x_1)≠f(x_2)\)

满射

  • 对任意 \(y∈W\) 都有一个元素 \(x∈V\) 使得 \(f(x)=y\)

    即存在原像

双射

  • \(f\) 既是单射,又是满射

    即一一对应

变换

  • \(V\) 是一个非空集合,\(V\) 到自身的映射称为 \(V\)变换
  • V到自身的双射称为V的一一变换
  • 若V是有限集,V的一一变换称为V的置换

线性映射、线性变换

  • 定义
    • \(V\)\(W\) 是数域 \(F\) 上的线性空间,如果映射 \(T:V→W\)满足下述性质,称 \(T\)\(V\)\(W\) 的一个线性映射
      • 可加性\(∀x,y∈V\)\(T(x+y)=T(x)+T(y)\)
      • 齐次性\(∀λ∈F\)\(T(λx)=λT(x)\)
    • 特别的,当 \(V=W\) 时, 称 \(T\)\(V\) 上的线性变换
      • 特殊的线性变换1

        定义映射 \(T:V→V\)

        • 零变换\(T(x)=θ, ∀x∈V\)
        • 恒等变换\(T(x)=x,∀x∈V\)
        • 负变换\(T(x)=− x,∀x∈V\)
      • 特殊的线性变换2

        定义 \(T:ℝ^2→ℝ^2,∀x=[x_1,x_2]^T∈ℝ^2\)

        • 伸缩\(T(x)=\bigg[ \begin{matrix} k_1 & 0 \\ 0 & k_2 \end{matrix} \bigg]x\)

          \(k_1\)\(k_2\) 为正常数

        • 反射\(T(x)=(x_1,−x_2)\)
        • 旋转\(T(x) = \bigg[ \begin{matrix} cos\varphi & -sin\varphi \\sin\varphi & cos\varphi \end{matrix}\bigg]x\)

          \(\varphi\) 为旋转角

  • 关于线性映射的tips
    • 定理 \(T\)是数域 \(F\)上线性空间 \(V\)\(W\)的线性映射,若\(α_1,⋯,α_p\)\(V\) 的一组向量,\(k_1,\cdots,k_p \in F\)
      • \(T(k_1α_1+⋯+k_pα_p)=k_1T(α_1)+⋯+k_pT(α_p)\)
    • 推论 \(T\)是数域 \(F\)上线性空间 \(V\)\(W\)的线性映射
      • \(T(θ)=θ^′, θ∈V,θ^′∈W\)

        几何意义——线性映射必须保持原点不动,故解析几何中常见的平移变换一般不是线性变换

      • \(T(−x)=−T(x),∀x∈V\)
      • \(α_1,⋯,α_p\)\(V\) 中一组线性相关向量, 则\(T(α_1),⋯,T(α_p)\)\(W\)中一组线性相关向量
      • \(T(α_1),⋯,T(α_p)\)\(W\) 中一组线性无关向量,则 \(α_1,⋯,α_p\)\(V\) 中一组线性无关向量
    • 定理 \(T\)是数域 \(F\)\(n\) 维线性空间 \(V\)\(m\)\(W\)的线性映射
      • 当且仅当 \(T\)单射时,\(V\)线性无关向量组\(W\)线性无关向量组
      • 当且仅当 \(T\)单射时,\(V\)一组基\(W\)一组基

        此时映射 \(T\) 是双射

    • 线性映射不一定将一组基映射为像空间的一组基
  • 关于线性变换的tips

    \(T\) 是线性空间 \(V\) 的线性变换

    • \(T\) 可逆,则逆变换是线性变换
    • \(T\) 在欧式空间\(V\) 的一组标准正交基 \(x_1,\cdots,x_n\) 的矩阵是对称阵,则 \((T(x_i),x_j)=(x_i,T(x_j))\)
  • 线性映射运算
    • 线性映射的加法运算
      • \(T_1, T_2\in \mathcal L(V,W)\),定义 \(T_1\)\(T_2\)\(\\\) \((T_1+T_2)(x)=T_1(x)+T_2(x)\)\(\forall x∈V\)
    • 线性映射的数乘运算
      • \(T\in \mathcal L(V,W),\lambda \in F\), 定义 \(λ\)\(T\)数乘\(\\\) \((\lambda T)( x)=\lambda\cdot T( x)\)\(\forall x∈V\)
  • 线性映射空间、线性变换空间
    • 集合 \(\mathcal L(V,W)\) 中赋以加法和数乘构成数域\(F\)上的线性空间,称为线性映射空间
      • \(\mathcal{L}(V,W)\)表示线性空间V到W的所有线性映射的集合
    • 特别地,\(\mathcal L(V)\)称为线性变换空间
    • 注意\(\rm dim(\mathcal L(V,W)) = \rm dim(V) \times \rm dim(W)\)
  • 线性映射值空间核空间
    • 定义
      • \(T \in \mathcal L(V,W)\)
      • 线性映射\(T\)核空间 (零空间)
        • \(N(T)=\{x∈V|T(x)=θ\}\)
      • \(T\)零度 (亏)
        • \(\rm dim(N(T))\)
      • 线性映射\(T\)值空间(像空间)
        • \(R(T)=\{y∈W|y=T(x),∀x∈V\}\)
      • \(T\)
        • \(\rm dim(R(T))\)
    • 性质
      • \(V\)\(W\)是数域\(F\)上的\(n\)维和\(m\)维线性空间,若\(T∈L(V,W)\)\(V\)的基\(ε_1,⋯,ε_n\)\(W\)的基\(η_1,⋯,η_m\)下的矩阵为\(A\)
        • \(\rm dimN(T)= dimN(A)\)
        • \(\rm dimR(T)=dimR(A)=rank(A)\)
        • \(\rm dimN(A)+dimR(A)=n\)
  • 正交投影变换
    • \(W\) 是线性空间 \(V\)非平凡子空间,定义 \(V\) 上的正交投影变换映射 \(T\)

      平凡子空间指零向量和自身

    • \(T(x)=\mathrm{Proj_W}x\)

      \(∀x∈V\)

    • \(\alpha_1,\cdots,\alpha_p\)\(W\)标准正交基
      • \(T(x)=\mathrm{Proj_W}x\\=(x,\alpha_1)\alpha_1+(x,\alpha_2)\alpha_2+\cdots+(x,\alpha_p)\alpha_p\)
  • 亏加秩定理

正交变换、酉变换

  • 定义
    • 欧氏 ()空间中的线性变换 \(T\) 保持向量的内积不变
    • \((T(x),T(y))=(x,y),∀x,y∈V\)
    • \(T\)正交)变换
  • 判定(充要条件)

    \(V\)\(n\)维欧氏(酉)空间,\(T∈\mathcal L(V)\)

    • \(T\)保持长度不变,即 \(\|T(x)\|=\|x\|\)
    • \(ξ_1,⋯,ξ_n\)\(V\) 中一组标准正交基\(\\\)\(T(ξ_1),⋯,T(ξ_n)\) 也是\(V\) 中一组标准正交基
    • \(T\)\(V\)的任一标准正交基下的矩阵为正交(酉)矩阵
  • 性质
    • 正交变换保持两个向量的夹角不变

同构映射

  • 定义

    其实就是线性映射+双射

    • \(V\)\(W\)是数域\(F\)上的线性空间,\(\forall x,y\in V\)\(\forall λ\in F\)
    • 存在双射 \(f:V→W\)满足
      • (1)\(f(x+y)=f(x)+f(y)\)
      • (2)\(f(\lambda x)=\lambda f(x)\)
    • 则称线性空间\(V\)\(W\)同构\(f\)\(V\)\(W\)同构映射
  • 性质

    设V和W是数域F上的线性空间,T: V→W是同构映射

    • \(T(\theta) = \theta^{\prime}\)\(\theta\in V,\theta^{\prime}\in W\)
    • \(T(-x)=-T(x)\)\(\forall x\in V\)
    • \(T(\sum\alpha_ix_i) = \sum \alpha_iT(x_i)\)\(\forall \alpha_i\in F,\forall x_i\in V\)
    • \(V\)的向量组 \(x_1,⋯,x_r\) 线性相关当且仅当其像\(T(x_1),⋯,T(x_r)\)线性相关
    • \(ε_1,⋯,ε_n\)\(V\)的一组基,则\(T(ε_1),⋯,T(ε_n)\)\(W\)的一组基
    • \(T\)逆映射\(T^{−1}: W→V\)存在且是同构映射
  • tips
    • 线性空间同构当且仅当它们的维数相等
    • 任一实(复)\(n\) 维线性空间均与 \(\Bbb R^n(\Bbb C^n)\) 同构
    • \(V\)是数域 \(\Bbb R(\Bbb C)\)上的\(n\)维线性空间,则线性变换空间\(L(V)\)\(\Bbb R^{n\times n}\)(或 \(\Bbb C^{n\times n}\))同构

通过矩阵乘法实现线性映射

  • 矩阵
  • 线性映射与矩阵的关系
    • 示例
  • 通过矩阵乘法实现线性映射
    • \(T\in \mathcal L(V,W)\)\(T\)\(V\)的基\(ε_1,⋯,ε_n\)\(W\)的基\(η_1,⋯,η_m\)下的矩阵为\(A\)
      • \(\Rightarrow\) \(T(ε_1,⋯,ε_n)\\ \triangleq[T(ε_1),⋯,T(ε_n)]\\=[η_1,⋯,η_m]A\)
    • \(\forall x\in V\),设
      • \(x=[ε_1,⋯,ε_n] \alpha\)
      • \(T(x)=[η_1,⋯,η_m]\beta\)
    • \(\Rightarrow\) \(\beta=A \alpha\)
  • tips
    • 线性映射在不同基下的矩阵是相抵的
    • 推论
      • 相似矩阵反映的是同一个线性变换

重要公式、定理


许尔公式

  • \(每个n 阶方阵\mathbf{A}=\mathbf{A}_{n\times n}\\ \text{都存在优阵 }\mathbf{Q}\\ \text{ 使得}\mathbf{Q}^{-1}\mathbf{A}\mathbf{Q}=\mathbf{D}=\begin{pmatrix}\lambda_1&\cdots&*\\&\ddots&\vdots\\0&&\lambda_n\end{pmatrix}\text{为上三角}\)
  • Schur引理

    酉相似三角化

    • 任意复方阵\(A\)酉相似于上三角阵\(\Lambda\)
    • 即存在U阵 \(U\) 使得 \(U^HAU=Λ\)
      • \(U^HAU=Λ\)
      • \(Λ\)——上三角矩阵
      • \(U\)——U阵
  • 实方阵Schur引理
    • \(A∈ℝ^{n×n}\)的特征值均为实数,则存在正交矩阵 \(Q\) 使得
  • tips
    • Schur引理表明任意复方阵都相似于上三角阵,但并不是所有复方阵都相似于对角阵
    • 酉相似对角化的矩阵
      • 正规阵
        • Hermite阵、反Hermite阵、正交阵、酉矩阵等都是正规阵
      • Householder矩阵
    • 求Hermite矩阵\(A\)酉相似于对角阵的步骤
      • 求出A的全部相异特征值及重数
      • 对于每个特征值 \(λ\),求方程\((λI−A)x=0\)的一个基础解系,并将其单位正交化处理
      • 由标准正交特征向量生成酉矩阵\(Q\),则\(Q^TAQ\)是对角矩阵

换位公式


特商公式

  • \(\displaystyle\lambda=\frac{X^HAX}{|X|^2},\text{其中}(X\neq0\text{为}\lambda\text{的一个特征向量})\)
    • \(\text{证明}:X^HAX=X^H\lambda X=\lambda X^HX=\lambda|X|^2(|X|^2>0)\)

平方公式

  • \(A\) 为半正定(\(A\ge 0\)),或 \(A\) 为正定(\(A>0\)
  • 则有分解 \(A=B^2\),且 \(B^H=B\) \(Hermite\) 半正定\(B\ge0\)
  • \(B\)\(A\) 的平方根,记作 \(\displaystyle B=\sqrt{A}=A^{\frac12}\)

秩公式

  • \(r(AA^H)=r(A^HA)=r(A)\)

亏加秩定理

  • 设T为数域F上的线性空间V到W的一个线性变换,即\(T \in \mathcal{L}(V,W)\)
  • \(\rm dimN(T)+dimR(T)=dimV\)
  • 即线性映射 \(T\) 的亏加秩等于其定义域 \(V\) 空间的维数

Cayley定理

  • \(n\) 阶方阵的特征多项式 \(T(x)=|xI-A|\) 也是它的一个 零化多项式\(\\\)即有 \(T(A)=0\)
  • 由该定理得到的有趣性质
    • \(A\in C^{n\times n}\),则\(A^n\)一定可以由\(A^{n-1},\cdots,A,I\)线性表示,其中\(n\geqslant2。\)
  • 例题

Cauchy—Schwarz不等式

  • 定义
    • \(V\)是数域\(F\)上的内积空间,对 \(\forall x, y∈V\),有 \(|(x,y)|≤‖x‖‖y‖\)
      • 注意:一般的线性空间不一定成立
    • 其中等号成立当仅当 \(x, y\)线性相关
  • 三角不等式
    • \(V\) 为欧式空间,则对任意的 \(\alpha,\beta\in V\),有
    • \(|\alpha+\beta|\le |\alpha|+|\beta|\)
  • 拓展

    定义不同内积可得到不同的Cauchy不等式

    • \(ℝ^n\) 中任两向量 \(x=[x_1,⋯,x_n]^T\)\(y=[y_1,⋯,y_n]^T\)
      • \(\displaystyle \left|\sum_{i=1}^nx_iy_i\right|\leq\sqrt{\sum_{i=1}^nx_i^2}\sqrt{\sum_{i=1}^ny_i^2}\)

Holder不等式

  • \(\forall x=[x_1,x_2,\cdots,x_n]^T \in \Bbb C^n,y=[y_1,y_2,\cdots,y_n]^T \in \Bbb C^n\)
  • \(p,q>1\),且\(\displaystyle \frac1p + \frac1q=1\)
  • \(\displaystyle \sum_{i=1}^n|x_iy_i|\le \bigg(\sum_{i=1}^n |x_i|^p\bigg)^{\frac1p}\bigg(\sum_{i=1}^n |y_i|^q\bigg)^{\frac1q}\)

Minkowski不等式

  • \(\forall x=[x_1,x_2,\cdots,x_n]^T \in \Bbb C^n,y=[y_1,y_2,\cdots,y_n]^T \in \Bbb C^n\)
  • \(p\ge1\)
  • \(\displaystyle \bigg(\sum_{i=1}^n|x_i+y_i|^p \bigg)^{\frac1p}\le \bigg(\sum_{i=1}^n |x_i|^p\bigg)^{\frac1p}+\bigg(\sum_{i=1}^n |y_i|^p\bigg)^{\frac1p}\)
posted @ 2024-12-20 12:50  Away-  阅读(764)  评论(0)    收藏  举报