矩阵论基础

矩阵是数学中的一个重要的基本概念,是代数学的一个主要研究对象,也是数学研究和应用的一个重要工具。“矩阵”这个词是由西尔维斯特首先使用的,他是为了将数字的矩形阵列区别于行列式而发明了这个述语。而实际上,矩阵这个课题在诞生之前就已经发展的很好了。从行列式的大量工作中明显的表现出来,为了很多目的,不管行列式的值是否与问题有关,方阵本身都可以研究和使用,矩阵的许多基本性质也是在行列式的发展中建立起来的。

1855 年,埃米特(C.Hermite,1822~1901)证明了别的数学家发现的一些矩阵类的特征根的特殊性质,如现在称为埃米特矩阵的特征根性质等。后来,克莱伯施(A.Clebsch,1831~1872)、布克海姆(A.Buchheim)等证明了对称矩阵的特征根性质。泰伯(H.Taber)引入矩阵的迹的概念并给出了一些有关的结论。 在矩阵论的发展史上,弗罗伯纽斯(G.Frobenius,1849-1917)的贡献是不可磨灭的。他讨论了最小多项式问题,引进了矩阵的秩、不变因子和初等因子、正交矩阵、矩阵的相似变换、合同矩阵等概念,以合乎逻辑的形式整理了不变因子和初等因子的理论,并讨论了正交矩阵与合同矩阵的一些重要性质。 1854 年,约当研究了矩阵化为标准型的问题。1892年,梅茨勒(H.Metzler)引进了矩阵的超越函数概念并将其写成矩阵的幂级数的形式。傅立叶、西尔和庞加莱的著作中还讨论了无限阶矩阵问题,这主要是适用方程发展的需要而开始的。

矩阵

矩阵类型

向量的类型根据元素的实际意义不同可以分为,

  1. 物理向量

    泛指既有幅值,又有方向的物理量,如速度、加速度、位移等。

  2. 几何向量

    为了将物理向量可视化,常用带方向的线段表示。这种有向线段出称为几何向量。

  3. 代数向量

    几何向量可以用代数形式表示。例如,若平面上的几何向量\(v=\vec{ab}\)中点a的坐标为\((a_1,a_2)\),点b的坐标为\((b_1,b_2)\),则该几何向量可以表示为代数形式\(\begin{bmatrix} b_1-a_1\\ b_2-a_2\\ \end{bmatrix} ​\)

其中,根据元素的类型不同,代数向量又可以分为以下三种,

  1. 常数向量

    向量中的元素为实数或复数

  2. 函数向量

    向量中的元素包含函数值,如\(\mathbf{x}=[1,x,x^2,...,x^n]^T\)

  3. 随机向量

    向量中的元素为随机变量或随机过程,如\(\mathbf{x}=[x_1(n),x_2(n),...,x_m(n)]^T\),其中\(x_1(n),x_2(n),...,x_m(n)\)\(m\)个随机过程或随机信号

矩阵运算

转置、共轭、共轭转置、加法、乘法和求逆

矩阵的基本运算包括矩阵的转置、共轭、共轭转置、加法、乘法和求逆 \[ A=\begin{bmatrix}{a_{11}} & {a_{12}} & {\cdots} & {a_{1 m}} \\ {a_{21}} & {a_{22}} & {\cdots} & {a_{2 m}} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{m 1}} & {a_{m 2}} & {\cdots} & {a_{m m}}\end{bmatrix} \] 1. 矩阵\(A\)转置记为\(A^T\),其元素定义为\([A^T]_{ij}=a_{ji}\)

\[ A^T=\begin{bmatrix}{a_{11}} & {a_{21}} & {\cdots} & {a_{m1}} \\ {a_{12}} & {a_{22}} & {\cdots} & {a_{m2}} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{1m}} & {a_{2m}} & {\cdots} & {a_{m m}}\end{bmatrix} \]

  1. 矩阵\(A\)共轭记为\(A^*\),其元素定义为\([A^*]_{ij}=a_{ij}^*\)

\[ A^*=\begin{bmatrix}{a_{11}^*} & {a_{12}^*} & {\cdots} & {a_{1 m}^*} \\ {a_{21}^*} & {a_{22}^*} & {\cdots} & {a_{2 m}^*} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{m 1}^*} & {a_{m 2}^*} & {\cdots} & {a_{m m}^*}\end{bmatrix} \]

  1. 矩阵\(A\)共轭转置记为\(A^H\),其元素定义为\([A^H]_{ij}=a_{ji}^*\)

\[ A^T=\begin{bmatrix}{a_{11}^*} & {a_{21}^*} & {\cdots} & {a_{m1}^*} \\ {a_{12}^*} & {a_{22}^*} & {\cdots} & {a_{m2}^*} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{1m}^*} & {a_{2m}^*} & {\cdots} & {a_{m m}^*}\end{bmatrix} \] 共轭转置又被称为Hermitian伴随、Hermitian转置或Hermitian共轭,\(A=A^T\)的实方阵称为对称矩阵,\(A=A^H\)的复方阵称为Hermitian矩阵

  1. 方阵\(A\)逆矩阵记为\(A^{-1}\)\(A^{-1}\)被定义为满足以下关系\(AA^{-1}=AA^{-1}=\mathbf{I}\)

  2. 加法与乘法

    • 两个\(m\times n\)矩阵\(A、B\)加法\([A+B]_{ij}=a_{ij}+b_{ij}\)

    • \(m\times n\)大小的矩阵\(A\)\(1\times n\)大小的向量\(x=[x_1,...,x_n]\)相乘,\([Ax]_i=\sum_{j=1}^na_{ij}x_j,\quad i=1,...,m\)

    • \(m\times n​\)大小的矩阵\(A​\)\(n\times r​\)大小的矩阵\(B​\)相乘,\([AB]_{ij}=\sum_{k=1}^na_{ik}b_{kj},\quad i=1,...,m;j=1,...,r​\)

    需要注意的是,一般来说,矩阵乘积是不满足交换律的

性质

关于矩阵中转置、共轭、共轭转置、求逆的性质

  1. 分配律

    \((A+B)^*=A^*+B^*,\quad (A+B)^T=A^T+B^T,\quad (A+B)^H=A^H+B^H​\)

  2. 矩阵乘积中转置、共轭转置、求逆的性质

    \((AB)^T=B^TA^T,\quad (AB)^H=B^HA^H,\quad (AB)^{-1}=B^{-1}A^{-1}​\)

  3. 转置、共轭、共轭转置与求逆交换

    \((A^*)^{-1}=(A^{-1})^*,\quad (A^T)^{-1}=(A^{-1})^T,\quad (A^H)^{-1}=(A^{-1})^H\)

矩阵函数

除了上述矩阵的基本运算之外,还有矩阵函数

  1. 三角函数 \[ \begin{aligned} \sin (\boldsymbol{A}) &=\sum_{n=0}^{\infty} \frac{(-1)^{n} \boldsymbol{A}^{2 n+1}}{(2 n+1) !}=\boldsymbol{A}-\frac{1}{3 !} \boldsymbol{A}^{3}+\frac{1}{5 !} \boldsymbol{A}^{5}-\cdots \\ \cos (\boldsymbol{A}) &=\sum_{n=0}^{\infty} \frac{(-1)^{n} \boldsymbol{A}^{2 n}}{(2 n) !}=\boldsymbol{I}-\frac{1}{2 !} \boldsymbol{A}^{2}+\frac{1}{4 !} \boldsymbol{A}^{4}-\cdots \end{aligned} \]

  2. 指数函数 \[ \begin{aligned} \mathrm{e}^{A} &=\sum_{n=0}^{\infty} \frac{1}{n !} \boldsymbol{A}^{n}=\boldsymbol{I}+\boldsymbol{A}+\frac{1}{2} \boldsymbol{A}^{2}+\frac{1}{3 !} \boldsymbol{A}^{3}+\cdots \\ \mathrm{e}^{-\boldsymbol{A}} &=\sum_{n=0}^{\infty} \frac{1}{n !}(-1)^{n} \boldsymbol{A}^{n}=\boldsymbol{I}-\boldsymbol{A}+\frac{1}{2} \boldsymbol{A}^{2}-\frac{1}{3 !} \boldsymbol{A}^{3}+\cdots \\ \mathrm{e}^{\boldsymbol{A} t} &=\boldsymbol{I}+\boldsymbol{A} t+\frac{1}{2} \boldsymbol{A}^{2} t^{2}+\frac{1}{3 !} \boldsymbol{A}^{3} t^{3}+\cdots \end{aligned} \]

  3. 对数函数 \[ \ln (I+A)=\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n} A^{n}=A-\frac{1}{2} A^{2}+\frac{1}{3} A^{3}-\cdots \]

  4. 矩阵导数 \[ \frac{\mathrm{d} \boldsymbol{A}}{\mathrm{d} t}=\dot{\boldsymbol{A}}=\left[ \begin{array}{cccc}{\frac{\mathrm{d} a_{11}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{12}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{1 n}}{\mathrm{d} t}} \\ {\frac{\mathrm{d} a_{21}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{22}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{2 n}}{\mathrm{d} t}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {\frac{\mathrm{d} a_{m 1}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{m 2}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{m n}}{\mathrm{d} t}}\end{array}\right] \]

  5. 矩阵积分 \[ \int \boldsymbol{A} \mathrm{d} t=\left[ \begin{array}{cccc}{\int a_{11} \mathrm{d} t} & {\int a_{12} \mathrm{d} t} & {\cdots} & {\int a_{1 n} \mathrm{d} t} \\ {a_{21} \mathrm{d} t} & {\int a_{22} \mathrm{d} t} & {\cdots} & {\int a_{2 n} \mathrm{d} t} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {\int a_{m 1} \mathrm{d} t} & {\int a_{m 2} \mathrm{d} t} & {\cdots} & {\int a_{m n} \mathrm{d} t}\end{array}\right] \]

特殊矩阵

对角矩阵、零矩阵、单位矩阵

幂等矩阵

幂等矩阵\(A\)具有以下性质:

幂单矩阵

又被称为对合矩阵,若\(A^2=AA=\mathbf{I}​\),若\(A​\)为幂单矩阵,则函数\(f(\cdot)​\)具有以下性质: \[ f(s \boldsymbol{I}+t \boldsymbol{A})=\frac{1}{2}[(\boldsymbol{I}+\boldsymbol{A}) f(s+t)+(\boldsymbol{I}-\boldsymbol{A}) f(s-t)] \] 其中,幂等矩阵和幂单矩阵也有关系,矩阵\(A\)是幂单矩阵,当且仅当\(\frac{1}{2}\boldsymbol({A}+\boldsymbol{I})\)

幂零矩阵

方阵\(A\)被称为幂零矩阵,若\(A^2=AA=\boldsymbol{O}\),若\(A\)为幂单矩阵,则函数\(f(\cdot)\)具有以下性质: \[ f(s \boldsymbol{I}+t \boldsymbol{A})=\boldsymbol{I}f(s)+t\boldsymbol{A}f^{\prime}(s) \]


Source from: 《矩阵分析与应用》,张贤达

-------------本文结束感谢您的阅读-------------
Donate comment here