矩阵
引入
在数学中,矩阵是一个按照长方阵列排列的复数或实数集合,最早来自于方程组的系数及常数所构成的方阵。这一概念由 \(19\) 世纪英国数学家凯利首先提出。
定义
由 \(m\times n\) 个数 \(a_{i,j}\) 排成的 \(m\) 行 \(n\) 列的数表称为 \(m\) 行 \(n\) 列的矩阵,简称 \(m\times n\) 矩阵。记作:
\[A=\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
a_{31} & a_{32} & \cdots & a_{3n} \\
\vdots & \ddots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn} \\
\end{bmatrix}
\]
这 \(m\times n\) 个数称为矩阵 \(A\) 的元素,简称为元。数 \(a_{i,j}\) 位于矩阵 \(A\) 的第 \(i\) 行第 \(j\) 列,称为矩阵 \(A\) 的 \((i,j)\) 元,以数 \(a_{i,j}\) 为 \((i,j)\) 元的矩阵可记为 \((a_{i,j})\) 或 \((a_{i,j})_{m\times n}\),\(m\times n\) 矩阵 \(A\) 也记作 \(A_{mn}\)。元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵。而行数与列数都等于 \(n\) 的矩阵称为 \(n\) 阶矩阵或 \(n\) 阶方阵。
基本运算
矩阵的基本运算包括矩阵的加法,减法,数乘,转置,共轭和共轭转置。
加法
\[\begin{bmatrix} 1 & 1 & 4 \\ 5 & 1 & 4 \\ \end{bmatrix} +
\begin{bmatrix} 1 & 1 & 4 \\ 5 & 1 & 4 \\ \end{bmatrix} =
\begin{bmatrix} 1+1 & 1+1 & 4+4 \\ 5+5 & 1+1 & 4+4 \\ \end{bmatrix} =
\begin{bmatrix} 2 & 2 & 8 \\ 10 & 2 & 8 \\ \end{bmatrix}
\]
矩阵的加法满足下列运算律(\(A\),\(B\),\(C\) 都是同型矩阵):
\[A+B=B+A \\
(A+B)+C=A+(B+C) \\
\]
应该注意的是只有同型矩阵之间才可以进行加法。
减法
\[\begin{bmatrix} 1 & 1 & 4 \\ 5 & 1 & 4 \\ \end{bmatrix} -
\begin{bmatrix} 1 & 1 & 4 \\ 5 & 1 & 4 \\ \end{bmatrix} =
\begin{bmatrix} 1-1 & 1-1 & 4-4 \\ 5-5 & 1-1 & 4-4 \\ \end{bmatrix} =
\begin{bmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ \end{bmatrix}
\]
数乘
\[2\cdot\begin{bmatrix} 1 & 1 & 4 \\ 5 & 1 & 4 \\ \end{bmatrix} =
\begin{bmatrix} 2\cdot1 & 2\cdot1 & 2\cdot4 \\ 2\cdot5 & 2\cdot1 & 2\cdot4 \\ \end{bmatrix} =
\begin{bmatrix} 2 & 2 & 8 \\ 10 & 2 & 8 \\ \end{bmatrix}
\]
矩阵的数乘满足以下运算律:
\[\lambda(\mu A)=\mu(\lambda A) \\
\lambda(\mu A)=(\lambda\mu A) \\
(\lambda+\mu)A=\lambda A+\mu A \\
\lambda(A+B)=\lambda A+\lambda B \\
\]
矩阵的加减法和矩阵的数乘合称矩阵的线性运算。
乘法
两个矩阵的乘法仅当第一个矩阵 \(A\) 的列数和另一个矩阵 \(B\) 的行数相等时才能定义。如 \(A\) 是 \(m\times n\) 矩阵和 \(B\) 是 \(n\times p\) 矩阵,它们的乘积 \(C\) 是一个 \(m\times p\) 矩阵 \(C=(C_{ij})\) ,它的一个元素:
\[c_{i,j}=a_{i,1}b_{1,j}+a_{i,2}b_{2,j}+\cdots+a_{1,n}b_{n,j}=\sum_{k=1}a_{i,k}b_{k,j}
\]
并将此乘积记为:\(C=AB\)。
例如:
\[\begin{bmatrix} 1 & 1 & 4 \\ 5 & 1 & 4 \\ \end{bmatrix} \times
\begin{bmatrix} 1 & 1 \\ 4 & 5 \\ 1 & 4 \\ \end{bmatrix} =
\begin{bmatrix}
(1\times 1+1\times 4+4\times 1) & (1\times 1+1\times 5+4\times 4) \\
(5\times 1+1\times 4+4\times 1) & (5\times 1+1\times 5+4\times 4) \\
\end{bmatrix} =
\begin{bmatrix} 9 & 22 \\ 13 & 26 \\ \end{bmatrix}
\]
矩阵的乘法满足以下运算律:
结合律:
\[(AB)C=A(BC)
\]
左分配律:
\[(A+B)C=AC+BC
\]
右分配律:
\[C(A+B)=CA+CB
\]
矩阵乘法不满足交换律。
转置
把矩阵A的行和列互相交换所产生的矩阵称为A的转置矩阵(\(A^T\)),这一过程称为矩阵的转置。
\[\begin{bmatrix} 1 & 1 & 4 \\ 5 & 1 & 4 \\ \end{bmatrix}^T =
\begin{bmatrix} 1 & 5 \\ 1 & 1 \\ 4 & 4 \\ \end{bmatrix}
\]
矩阵的转置满足以下运算律:
\[(A^T)^T=A \\
(\lambda A)^T=\lambda A^T \\
(AB)^T=B^TA^T
\]
共轭
矩阵的共轭定义为:\((A)_{i,j}=\overline{A_{i,j}}\),一个 \(2\times 2\) 复数矩阵的共轭(实部不变,虚部取负)如下所示:
\[A=
\begin{bmatrix}
1+i & 4 \\
5-i & 4 \\
\end{bmatrix}
\]
则
\[\overline{A}=
\begin{bmatrix}
1-i & 4 \\
5+i & 4 \\
\end{bmatrix}
\]
共轭转置
矩阵的共轭转置定义为:\((A^*)_{i,j}=\overline{A_{j,i}}\),也可以写为:\(A^*=(\overline{A})^T=\overline{A^T}\),或者写为 \(A^H\)。一个 \(2\times2\) 复数矩阵的共轭转置如下所示:
\[A=
\begin{bmatrix}
1+i & 4 \\
5-i & 4 \\
\end{bmatrix}
\]
则
\[A^*=
\begin{bmatrix}
1-i & 5+i \\
4 & 4 \\
\end{bmatrix}
\]
特殊矩阵
单位矩阵
主对角线上的元素都为 \(1\),其余元素全为 \(0\) 的 \(n\) 阶矩阵称为 \(n\) 阶单位矩阵,记为 \(I_n\) 或 \(E_n\),通常用 \(I\) 或 \(E\) 来表示。
大小为 \(n\) 的单位矩阵是在主对角线上均为 \(1\),而其他地方都是 \(0\) 的 \(n\times n\) 的正方矩阵。它用 \(I_n\) 表示,或有时阶数可忽略时就直接用 \(I\) 来表示。如下所示:
\[I_1=[1],
I_2=\begin{bmatrix} 1 & 0 \\ 0 & 1 \\ \end{bmatrix},
I_3=\begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \\ \end{bmatrix},
\cdots,
I_n=\begin{bmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \ddots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{bmatrix}
\]
同时单位矩阵也可以简单地记为一个对角线矩阵。
三角矩阵
三角矩阵是方形矩阵的一种,因其非零系数的排列呈三角形状而得名。三角矩阵分上三角矩阵和下三角矩阵两种。若 \(i>j\),则 \(u_{i,j}=0\) 的矩阵称为上三角矩阵,若 \(i<j\),则 \(u_{i,j}=0\) 的矩阵称为下三角矩阵。三角矩阵可以看做是一般方阵的一种简化情形。
对称矩阵
对称矩阵是一个方形矩阵,其转置矩阵和自身相等。即 \(A=A^T\)。例如:
\[A=
\begin{bmatrix}
1 & 1 & 4 \\
1 & 5 & 1 \\
4 & 1 & 4 \\
\end{bmatrix}
\]
稀疏矩阵
矩阵中非零元素的个数远远小于矩阵元素的总数,并且非零元素的分布没有规律,通常认为矩阵中非零元素的总数比上矩阵所有元素总数的值小于等于 \(0.05\) 时,则称该矩阵为稀疏矩阵,该比值称为这个矩阵的稠密度;与之相区别的是,如果非零元素的分布存在规律(如上三角矩阵、下三角矩阵、对角矩阵),则称该矩阵为特殊矩阵。
比较基本的定义是矩阵中的大多数元素为零,并且可以利用零元素节约大量存储、运算和程序运行时间。