矩阵的一些基本概念

声明:

本文并没有专门研究矩阵,而是为后面打算写的矩阵快速幂以及和矩阵相关的部分题目提供用来参考的粗浅概念。
另外,本文的相关内容大部分出自《算法导论》第八部分的附录D.1,在书中,我们通过做给出的一些练习题来得出一些矩阵的性质,因此在本文中也将会给出这些思考题的解答过程。

1.矩阵的概念

矩阵是矩形的数组。例如:
\( A = \begin{bmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{21} & a_{23} \end{bmatrix} = \begin{bmatrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{bmatrix} \)
是一个\(2 \times 3\)的矩阵\(A = (a_{ij})\),其中\(i = 1, 2, j = 1, 2, 3.\)矩阵中第\(i\)行第\(j\)列的元素通常表示为\(a_{ij}\)。我们用大写字母来表示矩阵,并用其对应的标有下标的小写字母来表示矩阵中的元素。

2.矩阵的转置

通过交换矩阵\(A\)的行和列获得的矩阵是矩阵\(A\)转置\(A^T\)。对于上文中的矩阵\(A\),其转置为:

\[ A^T = \begin{bmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{bmatrix}\]

3.一些特殊的矩阵

零矩阵

所有元素均为0的矩阵是一个零矩阵。该矩阵通常表示为\(0\)。这种表示与数字\(0\)相同。

方阵

正方形\(n \times n\)矩阵,方阵有很多个特例,在这里只列举其中几种。

对角矩阵

若一个矩阵对于任意\(i \ne j\),均有\(a_{ij} = 0\),则该矩阵是一个对角矩阵。因为对角矩阵的非对角元素均为\(0\),所以只需要列出其对角线上的元素就可以表示一个对角矩阵:

\[diag(a_{11}, a_{22}, ..., a_{nn}) = \begin{bmatrix} a_{11} & 0 & \cdots & 0 \\ 0 & a_{22} & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_{nn} \end{bmatrix} \]

单位矩阵

称对角线元素均为\(1\)\(n \times n\)对角矩阵为\(n \times n\)单位矩阵\(I_n\):

\[ I_n = diag(1, 1, ..., 1) = \begin{bmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{bmatrix} \]

对称矩阵

若一个矩阵\(A\)满足\(A = A^T\),则该矩阵为对称矩阵,例如:

\[ \begin{bmatrix} 1 & 2 & 3 \\ 2 & 6 & 4 \\ 3 & 4 & 5 \end{bmatrix} \]

是一个对称矩阵。

4.矩阵的基本运算

矩阵加法

定义矩阵加法如下。
如果\(A = (a_{ij})\)\(B = (b_{ij})\)\(m \times n\)矩阵,那么两者的矩阵和\(C = (c_{ij}) = A + B\)也是一个$m \times n \(矩阵,其中,对于\)i = 1, 2, ..., m\(与\)j = 1, 2, ..., n$,定义

\[c_{ij} = a_{ij} + b_{ij} \]

即矩阵相加是将两矩阵对应位置上的元素进行加法。零矩阵是矩阵加法的单位元:

\[A + 0 = A = 0 + A \]

对于矩阵加法,它满足以下运算性质:

  1. 交换律: \(A + B = B + A\)
  2. 结合律: \((A + B) + C = A + (B + C)\)

数乘矩阵

如果\(\lambda\)是一个数,\(A = (a_{ij})\)是一个矩阵,那么\(\lambda A = (\lambda a_{ij})\)是A的一个标量倍数。可以通过将矩阵中的每个元素分别乘以\(\lambda\)获得标量倍数(这个过程就是就是矩阵的数乘运算)。
作为一个特例,定义矩阵\(A = (a_{ij})\)\(-1 \cdot A = -A\)。矩阵\(-A\)的第\(i\)行第\(j\)列的元素为\(-a_{ij}\)。因此,

\[A + (-A) = 0 = (-A) + A \]

对于矩阵的数运算,它满足以下性质:

  1. 结合律: \(\lambda\mu A = \lambda(\mu A)\)以及\((\lambda + \mu)A = \lambda A + \mu A\)
  2. 分配律: \(\lambda(A + B) = \lambda A + \lambda B\)

矩阵减法

我们使用矩阵的负来定义矩阵减法: \(A - B = A + (-B)\)

矩阵乘法

矩阵乘法定义如下。
给定两个相容的矩阵\(A\)\(B\),即\(A\)的列数与\(B\)的行数相等。(通常,一个包含矩阵矩阵积\(AB\)的表达式总是假定矩阵\(A\)\(B\)是相容的。)如果\(A = (a_{ij})\)是一个\(m \times n\)的矩阵,并且\(B = (b_{ij})\)是一个\(n \times p\)的矩阵,那么他们的积\(C = AB\)是一个\(m \times p\)的矩阵\(C = (c_{ij})\),其中,对于\(i = 1, 2, ..., m, j = 1, 2, ..., p\prime,\)

\[c_{ij} = {\sum_{k=1}^{n}a_{ik}b_{kj}} \]

也就是说:\(C\)中第\(i\)行第\(j\)列的元素的值为:\(A\)中第\(i\)行所有元素与\(B\)中第\(j\)列所有元素一一对应相乘,然后将相乘后的所有值相加
由于矩阵乘法相较于其他基本运算来说有些难以理解,所以这里给出一个例子:

\(A = \begin{bmatrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{bmatrix} , B = \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}\),那么

\[A \times B = \begin{bmatrix} 1 \times 1 + 2 \times 3 + 3 \times 5 & 1 \times 2 + 2 \times 4 + 3 \times 6\\ 4 \times 1 + 5 \times 3 + 6 \times 5 & 4 \times 2 + 5 \times 4 + 6 \times 6 \end{bmatrix} = \begin{bmatrix} 22 & 28\\ 49 & 64 \end{bmatrix} \]

单位矩阵是矩阵乘法的单位元。对于任意\(m \times n\)矩阵\(A\)

\[ I_mA = AI_n = A \]

将任意矩阵乘以零矩阵总是得到零矩阵:

\[A0 = 0 \]

对于矩阵乘法,它满足以下性质:

  1. 结合律:
    \(A(BC) = (AB)C\)
    其中,矩阵\(A、B\)\(C\)是相容的。
  2. 矩阵乘法对加法满足分配律:
    \(A(B + C) = AB + AC\)
    \((B + C)D = BD + CD\)
    对于\(n > 1\)\(n \times n\)的矩阵乘法不满足交换律

5.练习题

D.1-1 证明:若\(A\)\(B\)均为\(n \times n\)对称矩阵,则\(A + B\)\(A - B\)也是\(n \times n\)对称矩阵

证明:
根据对称矩阵以及矩阵加法的定义,不难看出:
\(A, B\)是对称矩阵,那么:

\[ (A + B)^T = A^T + B^T = A + B \]

同理:

\[ (A - B)^T = [A + (-B)]^T = A^T + (-B)^T = A + (-B) = A - B \]

即证

D.1-2 证明: \((AB)^T = B^TA^T\),以及\(A^TA\)是对称矩阵

证明:
\(Part1\)

\[A = (a_{ij})_{m \times n}, B = (b_{ij})_{n \times p} \]

\[AB = C = (c_{ij})_{m \times p} \]

对于$$j = 1, 2, ..., m, i = 1, 2, ..., p$$

\[c_{ij} = \sum_{k=1}^{n}a_{jk}b_{ki} \]

因为

\[A^T = (a_{ji})_{n \times m}, B^T = (b_{ji})_{p \times n} \]

所以

\[B^TA^T = D = (d_{ij})_{p \times m} \]

对于$$i = 1, 2, ..., p, j = 1, 2, ..., m$$

\[d_{ij} = \sum_{k=1}^{n}b_{ki}a_{jk} = \sum_{k=1}^{n}a_{jk}b_{ki} \]

可以发现

\[d_{ij} = c_{ji} \]

\[D = C^T \]

也就是说:

\[(AB)^T = B^TA^T \]

\(Part2\)
\(Part1\)得出的结论可以得到:

\[(A^TA)^T = A^T(A^T)T \]

根据转置的定义容易发现:

\[(A^T)^T = A \]

所以

\[(A^TA)^T = A^TA \]

\(A^TA\)是对称矩阵

posted @ 2023-12-10 08:17  dbywsc  阅读(164)  评论(0)    收藏  举报