从向量空间到张量
1). 向量空间与对偶空间
上次的文章回顾了线性空间及其维数的定义,更重要的是介绍了线性空间的同构,以及提供了一种在给定有限维线性空间及其某个基的情况下,按照同构确定的相等关系[1]。有了这些背景知识,就可以回答张量理论中什么是反变与协变的问题。
我们定义线性空间上的线性函数。设 \(\textcolor{blue}{V}\)是一个线性空间,映射 \(\textcolor{blue}{f:V\to\mathbb R,}\)满足
- \(\textcolor{blue}{f\left(x+y\right)=f\left(x\right)+f\left(y\right);}\)
- \(\textcolor{blue}{f\left(kx\right)=kf\left(x\right). }\)
则称 \(\textcolor{blue}{f}\)是 \(\textcolor{blue}{V}\)上的一个线性函数。
进一步地,将 \(\textcolor{blue}{V}\)上的全体线性函数看作是一个集合,并且定义线性函数的加法和数量乘法
- \(\textcolor{blue}{\left(f+g\right)\left(x\right)=f\left(x\right)+g\left(x\right); }\)
- \(\textcolor{blue}{\left(kf\right)\left(x\right)=kf\left(x\right). }\)
于是可以自行验证,这样的集合构成了一个线性空间,称它为 \(\textcolor{blue}{V}\)的对偶空间,记为 \(\textcolor{blue}{V^*.}\)
假设 \(\textcolor{blue}{V}\)是一个 \(\textcolor{blue}{n}\)维线性空间,且它的一个基是 \(\textcolor{blue}{\left\{e_1,\cdots,e_n\right\},}\)那么关于 \(\textcolor{blue}{V^*}\)会出现怎样的结论呢?现在我来验证,它也是一个 \(\textcolor{blue}{n}\)维线性空间。
考虑 \(\textcolor{blue}{r_1,\cdots,r_n\in V^*,}\)使得
那么首先,对于任意 \(\textcolor{blue}{x\in V,}\)存在唯一的 \(\textcolor{blue}{x_1,\cdots,x_n\in\mathbb R,}\)使得
这时就可以说 \(\textcolor{blue}{\left(x_1,\cdots,x_n\right)}\)是 \(\textcolor{blue}{x}\)的坐标,其次,对于任意 \(\textcolor{blue}{f\in V^*,}\)成立
也就是说,只要我们确定了 \(\textcolor{blue}{f\left(e_1\right),\cdots,f\left(e_n\right)}\)的值,就唯一地确定了 \(\textcolor{blue}{f.}\)具体地说,就是
这就说明 \(\textcolor{blue}{\left\{r_1,\cdots,r_n\right\}}\)是 \(\textcolor{blue}{V^*}\)的一个基,空间 \(\textcolor{blue}{V^*}\)是一个 \(\textcolor{blue}{n}\)维线性空间。当然,映射 \(\textcolor{blue}{f}\)在这个基下的坐标是 \(\textcolor{blue}{\left(f\left(e_1\right),\cdots,f\left(e_n\right)\right).}\)
现在你是否有一个疑问,空间 \(\textcolor{blue}{V^{**}}\)看起来也是一个 \(\textcolor{blue}{n}\)维线性空间,关于它有什么结果吗?
按照刚才的讨论,空间 \(\textcolor{blue}{V^{**}}\)有一个基是 \(\textcolor{blue}{\left\{s_1,\cdots,s_n\right\},}\)其中
并且 \(\textcolor{blue}{g\in V^{**}}\)在这个基下的坐标是 \(\textcolor{blue}{\left(g\left(r_1\right),\cdots,g\left(r_n\right)\right),}\)即
此外,按照 \(\textcolor{blue}{V}\)到 \(\textcolor{blue}{V^{**}}\)的同构映射 \(\textcolor{blue}{\Gamma\left(e_i\right)=s_i,}\)成立 \(\textcolor{blue}{\Gamma\left(x\right)\in V^{**}}\)在 \(\textcolor{blue}{\left\{s_1,\cdots,s_n\right\}}\)下的坐标等于 \(\textcolor{blue}{x\in V}\)在 \(\textcolor{blue}{\left\{e_1,\cdots,e_n\right\}}\)下的坐标
这表明 \(\textcolor{blue}{V}\)与 \(\textcolor{blue}{V^{**}}\)是相等的!
进一步地,我们以后将不必区别对待 \(\textcolor{blue}{\Gamma\left(x\right)\in V^{**}}\)与 \(\textcolor{blue}{x,}\)由此介绍反变和协变概念。
称 \(\textcolor{blue}{V^*\to\mathbb R}\)的映射为 \(\textcolor{blue}{V}\)的一个反变,称 \(\textcolor{blue}{V\to\mathbb R}\)的映射为 \(\textcolor{blue}{V}\)的一个协变。按照上面的观点,空间 \(\textcolor{blue}{V}\)的反变就是它自己所属的向量,空间 \(\textcolor{blue}{V}\)的协变就是 \(\textcolor{blue}{V^*}\)所属的向量。
1.1 协变 逆变
协变和逆变的概念在物理学中极为普遍,它描述的是物理量随着参考系变化等变换而变换的特点.在现代物理学语言中,常常使用各种各样的线性空间来描述物理系统,其中一个向量表示一种状态,一组基底表示一种看待此系统的视角,比如参考系、表象等等,而向量的坐标则意味着在给定视角(基底)下的物理量.因此,协变和逆变实际上描述的是各种向量的坐标随着基底变换的变换特征.
简单来说,协变就是指坐标的变换矩阵和基底变换的过渡矩阵相同,而逆变就是指坐标的变换矩阵和过渡矩阵互逆.以二维\(V = \R^2\)旋转SO(2)为例,旋转矩阵\(R_\theta\)就是基变换矩阵
向量\(\textbf{a} = \begin{bmatrix} a_1 \\ a_2 \end{bmatrix} \in \R^2\),坐标变换遵循\(\widetilde {\textbf{a}} = \begin{bmatrix} a_1 \\ a_2 \end{bmatrix} = {R_\theta}^{-1}\textbf{a}\),所以向量表示是逆变的,向量空间中的向量是一阶协变张量。
(2). 多重线性函数
我默认读者已经掌握了线性空间及其维数和基、线性函数、对偶空间这些概念[2],以及简单的集合论常识。有限维线性空间的对偶空间也是有限维的,且维数和原来的空间相同,称对偶空间上的元素是一个协变,对偶空间上的线性函数是一个反变[3]。根据自然的同构,也可以认为反变就是原来的空间上的向量。
将线性空间上的线性函数概念做适当的推广。设 \(\textcolor{blue}{V_1,V_2,\cdots,V_p}\)分别是一个线性空间,它们的维数分别是 \(\textcolor{blue}{n_1,n_2,\cdots,n_p,}\)映射 \(\textcolor{blue}{f:V_1\times V_2\times\cdots\times V_p\to\mathbb R}\)满足
- $\textcolor{blue}{f\left(\cdots,u+v,\cdots\right)=f\left(\cdots,u,\cdots\right)+f\left(\cdots,v,\cdots\right); } $
- $\textcolor{blue}{f\left(\cdots,\lambda u,\cdots\right)=\lambda f\left(\cdots,u\cdots\right). } $
则称 \(\textcolor{blue}{f}\)是 \(\textcolor{blue}{V_1\times V_2\times\cdots\times V_p}\)上的一个 \(\textcolor{blue}{p}\)重线性函数。
将 \(\textcolor{blue}{V_1\times V_2\times\cdots\times V_p}\)上的全体 \(\textcolor{blue}{p}\)重线性函数构成的集合记为 \(\textcolor{blue}{\mathscr L\left(V_1,\cdots,V_p;\mathbb R\right),}\)特别地,对偶空间 \(\textcolor{blue}{V^*}\)就是关于空间 \(\textcolor{blue}{V}\)的 \(\textcolor{blue}{\mathscr L\left(V;\mathbb R\right).}\)
可以看出,如果你按照坐标分量写出空间 \(\textcolor{blue}{V}\)上的线性函数 \(\textcolor{blue}{f}\)的定义,那么它就和现在给出的多重线性函数的定义在形式上非常相似。也可以用相似的方法,定义 \(\textcolor{blue}{\mathscr L\left(V_1,\cdots,V_p;\mathbb R\right)}\)上的线性运算。
现在有一个问题是,集合 \(\textcolor{blue}{\mathscr L\left(V_1,\cdots,V_p;\mathbb R\right)}\)是不是一个线性空间,如果是,它是不是有限维的,甚至是可以求出维数的?
在有关对偶空间的讨论中,我们指出关于空间 \(\textcolor{blue}{V}\)的基 \(\textcolor{blue}{\left\{e_1,\cdots,e_n\right\},}\)相应的对偶空间 \(\textcolor{blue}{V^*}\)的对偶基是 \(\textcolor{blue}{\left\{r_1,\cdots,r_n\right\},}\)其中 \(\textcolor{blue}{r_1}\)将 \(\textcolor{blue}{e_1}\)映成 \(\textcolor{blue}{1,}\)将 \(\textcolor{blue}{e_2,\cdots,e_n}\)映成零,以此类推。
作为推广,在集合 \(\textcolor{blue}{\mathscr L\left(V_1,\cdots,V_p;\mathbb R\right)}\)中取出 \(\textcolor{blue}{n_1n_2\cdots n_p}\)个元素 \(\textcolor{blue}{\left\{r_{i_1,i_2,\cdots,i_p}\right\},}\)其中满足 \(\textcolor{blue}{i_j\in\left\{1,\cdots,n_i\right\},}\)元素 \(\textcolor{blue}{r_{i_1,i_2,\cdots,i_p}}\)将多重基向量 \(\textcolor{blue}{\left(e_{1;i_1},\cdots,e_{p;i_p}\right)}\)映成 \(\textcolor{blue}{1,}\)这里取空间 \(\textcolor{blue}{V_k}\)的基是 \(\textcolor{blue}{\left\{e_{k;1},\cdots,e_{k;n}\right\},}\)将其它多重基向量映成零,于是这 \(\textcolor{blue}{n_1n_2\cdots n_p}\)个元素线性无关,且对于任意 \(\textcolor{blue}{f\in\mathscr L\left(V_1,\cdots,V_p;\mathbb R\right),}\)存在 \(\textcolor{blue}{n_1n_2\cdots n_p}\)个实数,使得
所以说,集合 \(\textcolor{blue}{\mathscr L\left(V_1,\cdots,V_p;\mathbb R\right)}\)是一个 \(\textcolor{blue}{n_1n_2\cdots n_p}\)维线性空间。
我想用一个例子来说明建立多重线性空间概念的价值。我们都很熟悉欧式空间,它的特征是具有内积运算。设 \(\textcolor{blue}{x,y}\)分别是一个 \(\textcolor{blue}{n}\)维欧式空间上的向量,则
其中 \(\textcolor{blue}{x_i,y_i}\)分别是 \(\textcolor{blue}{x,y}\)的坐标分量。你会发现,这种对向量做内积的运算就是关于欧式空间的一个二重线性函数
只不过它相当简单,其中的多重坐标分量可以用一个矩阵表示,并且它恰好是一个单位矩阵。
以后我们会引入张量概念,同时张量是特殊的多重线性函数,甚至还可以进一步定义有关张量的运算。用张量的语言叙述几何学,将会带来很多便利。
(3). 张量的类型与阶
之前铺垫了那么多,就是为了在引入张量时能够舒服些,让你更容易看出定义背后的内涵。在过去的几篇文章里,首先我们引入了线性空间的同构[2],然后我们给出协变和反变概念,并利用自然同构,说明了对于线性空间 \(\textcolor{blue}{V,}\)可以将 \(\textcolor{blue}{V^{**}}\)和 \(\textcolor{blue}{V}\)看作是同一个空间[3],后来我们对线性函数进行推广,引入了多重线性函数[4]。
现在给出张量的定义。对于线性空间 \(\textcolor{blue}{V,}\)构造一个 \(\textcolor{blue}{p+q}\)重线性函数
则称 \(\textcolor{blue}{f}\)是 \(\textcolor{blue}{V}\)上的一个 \(\textcolor{blue}{\left(p,q\right)}\)型张量,或者一个 \(\textcolor{blue}{p+q}\)阶张量,称 \(\textcolor{blue}{p}\)为 \(\textcolor{blue}{f}\)的反变阶数,称 \(\textcolor{blue}{q}\)为 \(\textcolor{blue}{f}\)的协变阶数。
特别地,空间 \(\textcolor{blue}{V}\)自身的元素就是 \(\textcolor{blue}{V}\)上的一个 \(\textcolor{blue}{\left(1,0\right)}\)型张量,空间 \(\textcolor{blue}{V}\)的对偶空间 \(\textcolor{blue}{V^*}\)上的元素就是 \(\textcolor{blue}{V}\)上的一个 \(\textcolor{blue}{\left(0,1\right)}\)型张量。这说明一阶张量就是我们以往所说的向量。
称 \(\textcolor{blue}{V}\)上的 \(\textcolor{blue}{\left(p,0\right)}\)型张量为 \(\textcolor{blue}{p}\)阶反变张量,称 \(\textcolor{blue}{V}\)上的 \(\textcolor{blue}{\left(0,q\right)}\)型张量为 \(\textcolor{blue}{q}\)阶协变张量。
通过自然同构,可以将 \(\textcolor{blue}{V}\)上的 \(\textcolor{blue}{\left(p,q\right)}\)型张量 \(\textcolor{blue}{f}\)看作是
再根据上次的推导,得知 \(\textcolor{blue}{n}\)维空间 \(\textcolor{blue}{V}\)上的 \(\textcolor{blue}{\left(p,q\right)}\)型张量 \(\textcolor{blue}{f}\)可以表示为
其中 \(\textcolor{blue}{k_{i_1,\cdots,i_p,j_1,\cdots,j_q}}\)是 \(\textcolor{blue}{f}\)的分量,共有 \(\textcolor{blue}{n^{p+q}}\)个,且 \(\textcolor{blue}{p+q}\)重基函数 \(\textcolor{blue}{f_{i_1,\cdots,i_p,j_1,\cdots,j_q}}\)将 \(\textcolor{blue}{q}\)重基向量 \(\textcolor{blue}{\left(e_{j_1},\cdots,e_{j_q}\right)}\)映成 \(\textcolor{blue}{\left(e_{i_1},\cdots,e_{i_p}\right),}\)将其它 \(\textcolor{blue}{q}\)重基向量映成零。
当 \(\textcolor{blue}{p=0}\)时,将 \(\textcolor{blue}{\left(e_{i_1},\cdots,e_{i_p}\right)}\)替换成 \(\textcolor{blue}{1;}\)当 \(\textcolor{blue}{q=0}\)时,将 \(\textcolor{blue}{\left(e_{j_1},\cdots,e_{j_q}\right)}\)替换成 \(\textcolor{blue}{1.}\)
采取张量的观点看待欧式空间上的内积。取单位正交基
另取两个向量
做标准内积运算
其中
可以看出标准内积运算是欧式空间上的一个二阶协变张量
其中的分量 \(\textcolor{blue}{k_{j_1,j_2}}\)构成单位矩阵。
而在线性代数课上讨论的 \(\textcolor{blue}{n}\)维空间 \(\textcolor{blue}{V}\)上的线性变换
其中 \(\textcolor{blue}{A}\)是一个 \(\textcolor{blue}{n}\)级方阵,是一个 \(\textcolor{blue}{\left(1,1\right)}\)型张量,相应的分量 \(\textcolor{blue}{k_{i,j}}\)就是方阵 \(\textcolor{blue}{A}\)的分量。
这两个例子说明,以前用方阵表达的那些事物,可以被看作是二阶张量。
综上,可以直观地把 \(\textcolor{blue}{r}\)阶张量看作是 \(\textcolor{blue}{r}\)维的方阵。
(4). 平面Hermite内积
以向量的二元运算为例,我们有熟知的内积和外积运算。注意到,无论是内积还是外积,它们都是双线性的——简单起见,我们只考虑外积的大小不考虑方向,这样双线性映射都是映射到实数上。以平面的情况为例,两个平面实向量在自然基中有坐标(线性系数):
两向量形成的平行四边形,其夹角为\(\textcolor{blue}{\varphi = \alpha - \beta}\),其最大面积为\(\textcolor{blue}{ab}\)。由于内积和外积都只和夹角有关,和绝对角度无关,故可以用复向量构造Hermite内积\(\textcolor{blue}{\langle \cdot,\cdot \rangle}\),通过复共轭实现角度差:
(5). 张量积
我们注意到,实部和虚部都是由诸如 \(\textcolor{blue}{\pm a_ib_j}\)这样的一些项求和的结果,而这种求和方式正好是保持双线性结构所必须的。这些项都是两向量不同分量的乘积,是一种齐次项。这些项的指标组合一共有 \(\textcolor{blue}{2 \times 2}\)种,将它们写到一起,构成一个向量:
称为 \(\textcolor{blue}{2}\)-齐次向量(这里的 \(\textcolor{blue}{2}\)表示 \(\textcolor{blue}{2}\)-阶)。显然,\(\textcolor{blue}{v_{ab}}\)完全决定了(8)中的内积和外积。实际上,它包含了可以构造任意双线性映射的成份。
考虑 \(\textcolor{blue}{\mathbb{R}^2}\)中两个正交归一基可以通过平面旋转变换 \(\textcolor{blue}{R_\theta \in SO(2)}\)相联系:
基变换引起的向量的坐标会发生逆变:
展开为:
现在,根据(bb)的逆变关系,我们考虑 \(\textcolor{blue}{2}\)-齐次向量 \(\textcolor{blue}{v_{ab} \mapsto \tilde{v}_{ab}}\)是如何随基的变换而变换的。直接展开有如下关系:
中间的这个 \(\textcolor{blue}{(4 \times 4)}\)变换矩阵,用张量积(tensor product) \(\textcolor{blue}{\otimes}\)记号如下表示:
我们注意到 \(\textcolor{blue}{2}\)-齐次向量(aa)也有类似的构成,称为向量的二阶(由二个向量张成)张量积(tensor product):
现在我们得到了基的变换下齐次向量的变换关系,即(cc)构成以下映射:
映射 \(\textcolor{blue}{R_\theta^{-1} \otimes R_\theta^{-1}}\)称为平面旋转群 \(\textcolor{blue}{SO(2)}\)的 \(\textcolor{blue}{2}\)阶逆变张量(tensor)。
(6). 线性空间的张量
以上的例子告诉我们,两个逆变向量 \(\textcolor{blue}{\textbf{a},\textbf{b} \in \mathbb R^2}\),也叫做一阶逆变张量,在基变换 \(\textcolor{blue}{R_\theta}\)后的逆变关系为(dd),同时还可以构造二阶张量 \(\textcolor{blue}{\textbf{a} \otimes \textbf{b} \in \mathbb R^2 \otimes \mathbb R^2}\),它是二阶逆变张量,基变换 \(\textcolor{blue}{R_\theta}\)后的逆变关系为:
张量积 \(\textcolor{blue}{\textbf{a} \otimes \textbf{b}}\)决定了Hermite内积中实内积和实外积的组成成分,也就是齐次项(aa)。
进一步对于线性空间 \(\textcolor{blue}{V}\)中的 \(\textcolor{blue}{n}\)个逆变向量/一阶逆变张量 \(\textcolor{blue}{\{v_k\} \subset V}\),在基变换 \(\textcolor{blue}{R}\)下,都满足逆变规律:
这些逆变向量可以构成 \(\textcolor{blue}{n}\)-阶逆变张量 \(\textcolor{blue}{v_1 \otimes \dots \otimes v_n \in V_0^n = V \otimes \dots \otimes V}\),在基变换 \(\textcolor{blue}{R}\)下,满足逆变规律:
对于协变张量,也可以类似地构造。
令 \(\textcolor{blue}{V}\)为实域 \(\textcolor{blue}{\mathbb{R}}\)上的 \(\textcolor{blue}{n}\)维线性空间,则通过张量积构建的空间
称为 \(\textcolor{blue}{(r,s)}\)型张量空间, \(\textcolor{blue}{r}\)为逆变阶数(contra-variant order), \(\textcolor{blue}{s}\)为协变阶数(covariant order)。作为约定,我们记 \(\textcolor{blue}{r}\)阶逆变张量空间为 \(\textcolor{blue}{V_0^r}\),记 \(\textcolor{blue}{r}\)阶协变张量空间为 \(\textcolor{blue}{V_r^0}\)。
总的来说,张量的作用是用一个线性映射来替代多重的线性映射,令有 \(\textcolor{blue}{r}\)个线性空间 \(\textcolor{blue}{\{V_k\}}\),它们可以构成到线性空间 \(\textcolor{blue}{Z}\)的 \(\textcolor{blue}{r}\)-重线性映射:
若存在唯一的一个线性空间
及线性映射 \(\textcolor{blue}{g: W \to Z}\)使得这些映射可交换,那么 \(\textcolor{blue}{W}\)就是张量积。它是介于直积 \(\textcolor{blue}{\prod_{k=1}^{r} V_k }\)和线性空间 \(\textcolor{blue}{Z}\)之间的中介,张量积上的线性映射 \(\textcolor{blue}{g}\)替代了 \(\textcolor{blue}{r}\)-重线性映射 \(\textcolor{blue}{h}\)的作用。
浙公网安备 33010602011771号