置换与转置 permutations & transposes

置换与转置 permutations & transposes

​ 首先说一下置换矩阵(permutation matrix),通常记为\(\symbfit{P}\),是用来完成行互换操作的矩阵。\(\symbfit{P}_{i,j}\)记为第\(i\)行和第\(j\)行互换的置换矩阵。

​ 例如三行三列方阵有\(3!=6\)个置换矩阵,如\(\symbfit{P}_{2,1}=\begin{bmatrix}&1&\\1&&\\&&1\end{bmatrix}\)\(\symbfit{P}_{3,2}\symbfit{P}_{2,1}=\begin{bmatrix}&1&\\&&1\\1&&\end{bmatrix}\)等,单位矩阵\(\symbfit{I}=\begin{bmatrix}1&&\\&1&\\&&1\end{bmatrix}\)是特殊的置换矩阵,表示为各行均不变。\(n\)\(n\)列置换矩阵是行重新排列的单位矩阵,有\(n!\)种(或者说\(A_n^n\)种,即各行重新排列后可能的情况数)。置换矩阵都可逆,因为各行可以还原后得到单位矩阵,而且\(\symbfit{P}^{T}=\symbfit{P}^{-1}\)\(\symbfit{P}^{T}\symbfit{P}=\symbfit{I}\)。不难发现,如果这\(n!\)个置换矩阵两两相乘,或取逆运算,其结果仍在这\(n!\)个中,这实际上组成了一个群(group)。

​ 下面说一下转置(transpose),是将矩阵的行和列互换的操作,得到的新矩阵称为转置矩阵。例如

\[\begin{bmatrix} 1&3\\ 2&3\\ 4&1 \end{bmatrix}^{T} = \begin{bmatrix} 1&2&4\\ 3&3&1 \end{bmatrix} \]

用矩阵的描述即为\(\left(\symbfit{A}^T\right)_{i,j}=\symbfit{A}_{j,i}\),行的元素和列的元素交换。

​ 转置的规则是比较明确的:

​ 加法:

\[ \left ( \symbfit{A} + \symbfit{B} \right ) ^T=\symbfit{A}^T+\symbfit{B}^T \]

​ 乘法:

\[\left ( \symbfit{A}\symbfit{B} \right ) ^T=\symbfit{B}^T\symbfit{A}^T \]

​ 逆:

\[\left ( \symbfit{A}^{-1} \right ) ^T=\left ( \symbfit{A}^T \right ) ^{-1} \]

​ 对于加法运算,可以理解为矩阵\(\symbfit{A}\)\(\symbfit{B}\)先进行转置,然后做加法,其实质效果是一样的。逆矩阵的转置的规则随后可以通过乘法规则推导出来,因此,先考虑乘法规则是如何实现的。

​ 首先简单起见,令\(\symbfit{B}\)为一个向量\(\symbfit{x}\),考虑\(\left ( \symbfit{A}\symbfit{x} \right ) ^T=\symbfit{x}^T\symbfit{A}^T\)。我们有这么一个显而易见的结论:\(\symbfit{A}\symbfit{x}\)组合\(\symbfit{A}\)的行,而\(\symbfit{x}^T\symbfit{A}^T\)组合\(\symbfit{A}^T\)的列。这是相同向量的相同组合,这是很显然的,那么我们就可以将\(\symbfit{x}\)延伸到一个矩阵\(\symbfit{B}\)上,如果\(\symbfit{B}=\begin{bmatrix}\symbfit{x}_1&\cdots&\symbfit{x}_n\end{bmatrix}\),那么有

\[\symbfit{A}\symbfit{B}= \begin{bmatrix} \symbfit{A}\symbfit{x}_1 & \cdots &\symbfit{A}\symbfit{x}_n \end{bmatrix} \]

\[\symbfit{B}^T\symbfit{A}^T = \begin{bmatrix} \symbfit{x}_1^T\symbfit{A}^T \\ \vdots\\ \symbfit{x}_n^T\symbfit{A}^T \end{bmatrix} \]

这就形象说明了\(\left ( \symbfit{A}\symbfit{B} \right ) ^T=\symbfit{B}^T\symbfit{A}^T\)的原理。同样适用于多个矩阵的转置运算\(\left(\symbfit{A}\symbfit{B}\symbfit{C}\right)^T=\symbfit{C}^T\symbfit{B}^T\symbfit{A}^T\)。我们可以将其理解为交换顺序,即转置使得行列交换,因此需要交换顺序,再做运算。

​ 当然,以上规则同样适用于\(\symbfit{A}^{-1}\symbfit{A}=\symbfit{I}\),等式两边同时转置,得到

\[\symbfit{A}^T\left(\symbfit{A}^{-1}\right)^T=\symbfit{I}^T=\symbfit{I} \]

\[\left ( \symbfit{A}^{-1} \right ) ^T=\left ( \symbfit{A}^T \right ) ^{-1} \]

这里要说明一点,当\(\symbfit{A}\)可逆时,\(\symbfit{A}^T\)也可逆。

​ 最后说一下对称矩阵(symmetric matrix),它的转置等于它本身,记为\(\symbfit{S}\),即\(\symbfit{S}=\symbfit{S}^T\)。例如\(\symbfit{S}=\begin{bmatrix}3 & 1 & 7\\1 & 2 & 9\\7 & 9 & 4\end{bmatrix}\)

​ 对称矩阵的逆矩阵也是对称矩阵,因为\(\symbfit{S}^{-1}=\left(\symbfit{S}^T\right)^{-1}=\left(\symbfit{S}^{-1}\right)^T\)

​ 下面说一下对称矩阵构建的一个方法:如果一个矩阵是长方形矩阵(行数<列数),那么记为\(\symbfit{R}\)(rectangular matrix),那么有\(\symbfit{R}^T\symbfit{R}\)总是对称的。因为我们可以转置一下看看:

\[\left(\symbfit{R}^T\symbfit{R}\right)^T = \symbfit{R}^T\left(\symbfit{R}^T\right) = \symbfit{R}^T\symbfit{R} \]

​ Gilbert Strang教授在他的书中提到过转置与求导的关系,感兴趣的可以在书中查看(第122页)。

posted @ 2024-12-08 18:36  海豹熘鱼片  阅读(347)  评论(0)    收藏  举报