矩阵论复习总结


矩阵论复习总结

关于期末考试常见考点题型的总结,有所错误欢迎指正

一、矩阵的相似变换

多项式化简

特征多项式,最小多项式

求解最小多项式

(1)$mA(\lambda) = \frac{\phi (\lambda)}{D{n-1}(\lambda)}$,其中$\phi(\lambda)=det(\lambda I -A),D_{n-1}$为 $\lambda I -A$的n-1阶行列式因子

(2)书中定理1.17:设$A\in C^{m\times n}$,$\lambda_1,\lambda_2,\dots,\lambda_t$是A的所有互不相同的特征值,则:

其中$m_i$是$A$的Jordan标准形$J$中含$\lambda_i$的Jordan块的最高阶数

Schmidt正交化方法

(记忆)从线性无关向量组导出正交向量组的方法

Schmidt只做了正交化处理,若想获得标准正交基还要在此基础上进行单位化(各自除以各自正交基的模值)

相似对角化$P^{-1}AP=\wedge$

能相似对角化的前提是矩阵$A\in C^n$有n个线性无关的特征向量

Jordan标准形$P^{-1}AP=J$

(1)特征向量法

Jordan矩阵阶数等价于特征值的个数(包括重数),Jordan块的个数等价于线性无关的特征向量的数量,每个Jordan块的对角元素是相对应的特征值

注意:某一特征值重数较高时可能无法确定Jordan块

(2)初等变换法

首先将特征矩阵($\lambda I -A$)化为Smith标准形,得到不变因子,然后再计算得到初等因子。每个初等因子的幂次为Jordan块阶数,元素是对应的特征值,总和为原矩阵的阶数。

(3)行列式因子法

先求出特征矩阵所对应的n个行列式因子,然后根据公式算出A的不变因子,然后算初等因子和Jordan标准形

求相似变换矩阵P

page15
待完成

酉相似$U^{-1}AU=\wedge$, $\quad U^{-1}AU=T$

这里$T$表示上三角矩阵

常用定义和定理

Smith标准形:

不变因子$d_k(\lambda)$:smith标准形里的元素,$dr(\lambda) = \frac{D_r(\lambda)}{D{r-1}(\lambda)}$

初等因子:所有不变因子中的一次因式方幂

行列式因子$D_k(\lambda)$:$A(\lambda)$的全部k阶子式的首一最大公因式$D_k(\lambda)$(子式的取得方法与余子式一致,不全是连续的行或列构成的子式)

零化多项式$f(\lambda)$:$f(\lambda)$为多项式,使$f(A)=0$

最小多项式:A的零化多项式中次数最低的首一多项式,即包含了所有互不相同的特征值(即每个特征值对应一个Jordan块)

酉矩阵:$A^HA = I$,当矩阵内元素全为实数时退化为正交矩阵,即$A^TA=I$

二、范数理论

证明构造的向量范数是向量范数

证明构造的矩阵范数是矩阵范数

需要证明4个性质均满足:

非负性:当$A\neq 0$时,$||A||>0$,当$A=0$时,$||A||=0$.

齐次性:对任意$\lambda\in C$,$||\lambda A|| = |\lambda|\cdot ||A||$

三角不等式:对任意$A,B\in C^{n\times n}$,都有$||A+B||\le||A||+||B||$

三角不等式证明:

相容性:对任意$A,B\in C^{n\times n}$,都有$||AB||\le||A||\quad ||B||$

相容性证明:首先进行第一次放缩:和的模小于模的和;然后进行第二次放缩:积的和小于和的积,若外部带次幂,则利用Cauchy-Schwarz不等式或者holder不等式。卡壳时也可根据结果倒推中间部分过程。

特殊情况下有时还需对原范数形式进行一定变形才会更好证明(如平方或数乘等)

证明矩阵范数与向量范数相容

若上式满足,则说明矩阵范数$||\cdot||_m$与向量范数$||\cdot||_v$是相容

与证明矩阵范数的相容性类似

范数证明常用放缩方式

(1)$|\sum\limits{k=1}^n a{ik}b{kj}|\le \sum\limits{k=1}^n |a{ik}||b{kj}| \le \sum\limits{k=1}^n |a{ik}|\sum\limits{k=1}^n|b{kj}|$

(2)$(\sum\limits{k=1}^n |a{ik}||b{kj}|)^2 \le (\sum\limits{k=1}^n |a{ik}|^2)(\sum\limits{k=1}^n|b_{kj}|^2)$ (C-S不等式)

(3)$|x_i+y_i|^2 \le (|x_i|+|y_i|)^2$

(4)$\sum |x{i}||y{i}| \le (\sum |x{i}|^p)^{\frac{1}{p}}(\sum|y{i}|^q)^{\frac{1}{q}}$,其中${\frac{1}{p}}+{\frac{1}{q}}=1$

常见范数总结

其中$x=(x_1,x_2,\dots,x_n)^T$。

导出范数定义(一般都是将分母取1消掉max符号):

注意:复数的模($z = a+bi$): $|z| = \sqrt{a^2+b^2}$

三、矩阵分析

矩阵函数值计算

(1)利用Hamilton-Cayley定理化简求解

Hamilton定理:$\phi(\lambda) = det(\lambda I -A)=p[\lambda]^n=0 \rightarrow \phi(A)=0$

(2)对角矩阵法

若$A$可对角化,则可以推出$f(A)=\sum\limits^{+\infty}_{k=0}a_kA^k=Pdiag(f(\lambda_1),f(\lambda_2),\dots,f(\lambda_n) )P^{-1}$

同理可得$f(At)=Pdiag(f(\lambda_1t),f(\lambda_2t),\dots,f(\lambda_nt) )P^{-1}$

(3)Jordan标准形

其中$J_i$为Jordan块

(4)待定系数法

也是根据Hamilton定理进行处理:

其中$\phi(A)=0$,所以可以推出$\phi^{(l)}(\lambdai)=0 \quad(l=0,1,\dots,r{i-1};i=1,2,\dots,s)$

所以可以得到下面的一组方程解:

解出$b_k$后即可算出$f(At)$,$r$表示某特征值的重数,$s$表示互不相同的特征值的个数,等式右侧若是$l$阶导数,则记得乘$t^l$。

数量函数对矩阵变量的导数

待完成

求微分方程的解

求解非齐次微分方程组$\frac{d}{dt}x(t) = Ax(t)+b(t)$

(1)计算矩阵指数函数$e^{At}$

(2)计算积分$y(t) = \int^t_{t_0}e^{-A\tau}b(\tau)d\tau\quad$(把$e^{At}$中的$t$替换为$-\tau$即可,$b(\tau)$中的$e^\tau$为标量)

(3)计算满足初始条件$x(t_0)=x_0$的解$x(t)=e^{At}x_0+e^{At}y(t)$

常见矩阵函数总结

幂级数收敛条件

矩阵函数$\sum\limits{k=0}^{+\infty}a_kA^k$的谱半径小于其对应的幂级数$\sum\limits{k=0}^{+\infty}akz^k$的收敛半径$R = \lim\limits{n\rightarrow\infty}|\frac{a{n}}{a{n+1}}|$(相邻级数系数之比)
,则表示矩阵函数收敛。

若等于时,则需要判断矩阵内各元素是否收敛,全收敛则收敛。

四、矩阵分解

QR分解

Q是酉矩阵,R是具有正对角元的上三角矩阵,分解结果是唯一的

(1)Schmidt正交化方法

(矩阵A要可逆)首先将A的列向量进行schmidt正交化,

然后再单位化后的结果就是Q,

最后R的每一列根据Schmidt公式和单位化公式反向表示出原列向量$a_j$的方程组的各元素系数得出。

其中$qk=\frac{p_k}{||p_k||_2}$,$p_k$则是根据Schmidt正交化得来,$\lambda{ij}=\frac{(a_i,p_j)}{(p_j,p_j)}$

(2)Givens变换

与HouseHolder变换的主要区别是每列变换时不是一个H矩阵,而是一系列的givens矩阵。

givens变换从几何上理解可以理解为旋转变换,因此模长不会改变,

性质:givens矩阵T是酉矩阵,且行列式值为1

第1列:

根据矩阵$A$选取c,s生成givens矩阵$T{12}$,计算$T{12}A$,观察第一列列向量是否只有第一维非0,若不是,则从$T{12}A$选取新的c,s从而生成新的givens矩阵$T{13}$,计算$T{13}T{12}A$的结果。重复上述操作直至第一列列向量满足第一维元素非0,其他维为0.如果原矩阵或累乘矩阵第$j$行第1列位置元素本身为0,则跳过计算$T_{1j}$,计算后续非零位置对应的givens矩阵。

第2列:

后续每列和第一列操作类似

最后得$R = T{n-1,n}\dots T{2n}\dots T{23}T{1n}\dots T_{12}A$,

$Q=T{12}^H\dots T{1n}^HT{23}^H\dots T{2n}^H\dots T_{n-1,n}^H$

givens矩阵T的生成规则,T一般是方阵,givens矩阵是在单位矩阵$I$的基础上,根据矩阵$T{ij}$的下标替换对应$t{ii},t{ij},t{ji},t_{jj}$的元素。($i<j$)然后替换元素满足下式:

c和s的求法:
与givens矩阵$T{ij}$下标和累乘矩阵($A,T{12}A,\dots$)有关,即$c=\frac{a{ii} }{\sqrt{a{ii}^2+a{ij}^2} }$,$s=\frac{a{ij} }{\sqrt{a{ii}^2+a{ij}^2} }$

(3)Householder变换

Householder变换从几何上可以理解为镜面反射变换,因此模长也不变

$A = (a_1,a_2,\dots,a_n)$($n\ge 3$)

第1列:

取$a1=(a{11},a{21},\dots,a{n1})$,计算$u_1=\frac{a_1-\alpha_1 e_1}{||a_1-\alpha_1 e_1||_2}$,其中$\alpha_1 = ||a_1||_2$,$e_1$为单位向量(第一项为1,其余为0,维数为n维)

计算$H_1 = I-2u_1u_1^T, B=H_1A$

第2列:

取$b2 =(b{22},\dots,b_{n2})$(n-1维),计算$\tilde{u_2}=\frac{b_2-\alpha_2 \tilde{e_1} }{||b_2-\alpha_2 \tilde{e_1}||_2}$,其中$\alpha_2=||b_2||_2$,$\tilde{e_1}$为单位向量(维数为n-1维)

计算$\tilde{H_2} = I-2u_2u_2^T$(n-1维),$H_2={\begin{bmatrix}
1& 0^T\
0 & \tilde{H_1}\
\end{bmatrix} }$,$C = H_2H_1A$

第n-1列:

取$x{n-1} =(x{n-1,n-1},\dots,b{n,n-1})$(2维),计算$\tilde{u{n-1} }=\frac{x{n-1}-\alpha{n-1} \tilde{e1} }{||x{n-1}-\alpha{n-1} \tilde{e_1}||_2}$,其中$\alpha{n-1}=||x_{n-1}||_2$,$\tilde{e_1}$为单位向量(维数为2维)

计算$\tilde{H{n-1} } = I-2u_2u_2^T$(2维),$H{n-1}={\begin{bmatrix}
1& & 0^T\
& \ddots& \
0& & \tilde{H{n-1} }\
\end{bmatrix} }
{n\times n}$ , $R = H{n-1}\dots H_2H_1A$ ,$\quad Q = H{1}H2\dots H{n-1}$

注意:在此过程中只要$H_{t}\dots H_2H_1A$为上三角矩阵即可停止

满秩分解

满秩分解不唯一

(1)逆矩阵方法

算出Hermite标准形变换过程中的矩阵S,T

首先进行行变换使得$(A,I_m)\rightarrow(H,S)$

然后进行列变换使得${\begin{bmatrix}
H \
I_n\
\end{bmatrix} }\rightarrow {\begin{bmatrix}
{\begin{bmatrix}
I_r&0 \
0&0\
\end{bmatrix} } \
T\
\end{bmatrix} }$

最后可以得到$F=s^{-1}{\begin{bmatrix}
I_r \
0\
\end{bmatrix} }$, $G=(I_r \quad 0)T^{-1}$

(2)Hermite标准形方法

A的Hermite标准形H:矩阵A经过行变换后的阶梯矩阵(每一行首非0元素为1且对应列只有该元素非0)

取A的$j_1,j_2,\dots,j_r$列构成矩阵F(列满秩),取H的前r行构成矩阵G(行满秩),则$A=FG$即为A的一个满秩分解。

快速求解二阶矩阵的逆:行列式不为0的情况下,主对角线元素互换,副对角线元素变号,外面再乘行列式分之一,这在算由满秩分解的FG来求得的$A^+$时如果求逆为2阶,会更快

五、特征值的估计与表示

盖尔圆(Gerschgorin)分离矩阵特征值

先算出矩阵$A$的盖尔圆,然后选取对角矩阵$D$,计算矩阵$B=DAD^{-1}$的盖尔圆,使得相交的盖尔圆分离(矩阵D第i个元素大于1,则放大第i个盖尔圆,反之小于1则缩小第i个盖尔圆)

盖尔圆:

其中$Ri = \sum\limits^{n}{j=1,j\neq i}|a_{ij}|, (i=1,2,\dots,n)$,注意半径R是模值

Rayleigh商

其中$A$为Hermite矩阵,$0\neq x\in C^n$
矩阵$A$的特征值与Rayleigh商的关系:

六、广义逆矩阵

$A^{ {1} }$的计算

根据满秩分解逆矩阵法得来:

P为置换矩阵。

当$L\neq0$时,$X = A^{ {1} }$,当$L=0$时,$X = A^{ {1,2} }$

$A^{ {1} }$的性质

在这里$A^{(1)}$表示为$A^{ {1} }$的一个实例

(6)$AA^{(1)} = I_m \leftrightarrow rankA=m$

(7)$A^{(1)}A = I_n \leftrightarrow rankA=n$

Moore-Penrose逆$A^+$的计算

由满秩分解$A = FG$而来:

F列满秩,G行满秩

常用结论和性质:

当$rankA=m$时:$A^+ = A^H(AA^H)^{-1}$

当$rankA=n$时:$A^+ = (AA^H)^{-1}A^H$

当矩阵A为酉矩阵时:$A^+ = A^H(AA^H)^{-1}=A^HI=A^H$

$A^+$的应用

常用来求解形如$AX=b$的线性方程组

解的公式是一致的,但是根据有解无解会有不同的名称:

解:

通解:

极小范数解:

解:

全部最小二乘解:

极小范数最小二乘解:

七、矩阵的特殊乘积

直积

直积性质

(1)$(A\otimes B)^T = A^T\otimes B^T,(A\otimes B)^H = A^H\otimes B^H,$

(2)$(A\otimes B)(C\otimes D) = (AC)\otimes (BD)$

(3)$(A\otimes B)^{-1} = A^{-1}\otimes B^{-1}$

直积的应用

可以把方程拉直,可以方便的得出有解成立的条件(用到的性质):

八、线性空间与线性变换

1 根据子空间$W_1,W_2$,求$W_1\cup W_2$和$W_1\cap W_2$的基和维数

假定$W_1 = span{ \alpha_1,\alpha_2}$, $W_2 = span{ \beta_1,\beta_2}$。

那么$W_1\cup W_2=span{ \alpha_1,\alpha_2,\beta_1,\beta_2}$,要求出$W_1\cup W_2$,将$span{ \alpha_1,\alpha_2,\beta_1,\beta_2}$中的每个元素按列向量的形式写成矩阵形式,再进行多次行变换得到阶梯矩阵,每行首一元素所对应的列向量就是$W_1\cup W_2$所需要的基,也是极大线性无关组,个数也就是维数。

$W_1\cap W_2$则是利用两子空间交集的线性表出相等(即交集的基)得到方程组,然后求解此方程组得到线性表出的系数,然后再根据线性表出写出交集的基和维数。(线性表出也可理解为线性组合)

2 求线性变换T的值域(R(T) )与核(N(T) )的基与维数

值域:

$R(T) =span {T( \alpha _1),T( \alpha _2),\dots ,T( \alpha _n)}$

根据上式计算原线性空间基经过线性变换后的最大无关组即为值域的基,维数等于秩

核:

设$x\in N(T)$,根据$T(x)=0$计算出x的通解,x的基础解系即为核的基,维数等于基础解系的个数

3 求过渡矩阵

在基$\alpha_1,\alpha_2,\dots,\alpha_n$到基$\beta_1,\beta_2,\dots,\beta_n$的过渡矩阵$C$,满足下列关系式(顺序不要搞混):

所以求过渡矩阵有两种方法:

(1) 直接法 :直接求$\beta$在基$\alpha$下的坐标,该坐标集合即为过渡矩阵

(2)间接法:以简单基为媒介进行求解(其中E为简单基,每一列向量只有一项为一且位置不同)

4 求线性变换T在某一基下的矩阵A

在不同基下所对应T的矩阵主要依据下式进行变换求解:

比如说从基$(\alpha_1,\alpha_2,\dots,\alpha_n)$到$(\beta_1,\beta_2,\dots,\beta_n)$所对应的矩阵变换关系如下式所示:

经过推导可得:

所以可得$B=P^{-1}AP$,重要是推导过程中的思想,理解了思路,题型稍微变化也能自己推出来

5 证明不变子空间

T是V的一个线性变换,W是V的一个子空间,任意$\alpha$ 都满足 $\alpha \in W \rightarrow T(\alpha) \in W$,则W是V的不变子空间

若$T$的变换已知,则X未知也可以直接计算$T(X)$来判断W是否为不变子空间

证明线性变换T是否为可逆变换

(1)法一:判断T是否为双射(单射和满射均满足,一一对应),是双射则说明T为可逆变换

单射成立判断条件:$T(x)=T(y)\rightarrow x=y$

双射判断条件:?暂时不清楚

(2)法二:判断T在某一组基下的矩阵是否可逆,A不可逆则说明T不可逆

6 求线性子空间的基使线性变换的矩阵为对角矩阵

(1)先确定线性子空间$W$上的简单基$E$

(2)写出线性变换$T$在基$E$下的矩阵$A$(算出每个简单基所对应的线性变换,然后用简单基进行表示,然后提出的系数即为A的列向量)

(3)求出$A$的特征值和特征向量,进一步写出相似变换矩阵$P$($P$由特征向量组成)

(4)算出对应矩阵$P^{-1}AP$的基$\beta$($\beta =EP$)($\beta_i = (e_1,e_2,\dots,e_n)p_i$),即最终结果。

注意:要求基为标准正交基时,对特征向量进行正交化,正交化后得到的正交变换矩阵$Q$,类似的,按照上述第四步,$Q^{-1}AQ$的基$\beta = EQ$即为最终结果。

7 求欧氏空间的度量矩阵

度量矩阵的定义:

式中$\alpha_i,\alpha_j$为线性空间$V$的第$i,j$个基,度量矩阵是可逆的

注意内积的具体计算方式根据题目的定义来判断

8 投影变换

定义:设L与M为$C^n$的子空间,且$C^n=L+M$,即$C^n$是L与M的直和(唯一分解形式)。任意$x\in C^n$可唯一分解为$x=y+z$,其中$y\in L$,$z\in M$。称y为x沿M到L的投影,将x变为沿着M到L的投影y的变换称为沿M到L的投影变换,记为$P_{L,M}$,即:

投影变换在简单基下的矩阵称为投影矩阵,记为$\mathbf{P_{L,M} }$

投影矩阵计算方法:$P_{L,M} = (X,\mathbf{0})(X,Y)^{-1}$,其中$X,Y$分别为子空间$L,M$的基

正交投影变换

设L是$C^n$的子空间,则称沿着$L^{\perp}$(正交补空间)到$L$的投影变换$P_{L,L^{\perp} }$为正交投影变换,简记为$P_L$

投影矩阵计算方法:根据正交补空间的性质可以得到$X^HY=0$,所以:

Moore-Penrose逆的等价定义

等价定义:设$A\in C^{m\times n}$,若存在$X\in C^{n\times m}$使得:

则称$X$为$A$的Morre-Penrose逆(即$A^+$),即$AA^+$为投影矩阵

线性子空间有关证明的性质

(1)若$V_1,V_2$是线性空间$V^n$的子空间,则$V_1\cap V_2$和$V_1+V_2$也是$V$的子空间,所以维数均小于等于n($V_1+V_2$可以近似理解为$V_1\cup V_2$)

(2)$dim(V_1+V_2)=dimV_1 + dimV_2-dim(V_1\cap V_2)dim(V_1\cap V_2)=dimV_1 + dimV_2-dim(V_1+ V_2)$

(3)(线性变换)$dimR(T) = rankA\quad dimN(T) = n-rankA$

(4)下面四种说法等价:

1)$V_1+V_2$是直和 (可以理解为两个子空间没有交集,所以两个子空间的基互相也是线性无关的)

2)$V_1+V_2$中零元素的分解式唯一

3)$V_1\cap V_2={0}$

4)$dim(V_1+V_2)=dimV_1+dimV_2$

核心定义和定理

线性变换的定义:同时满足下面两式的变换:

证明题常见题型

直和

分为两步,

第一步,先证$W_1\cap W_2={0}$,首先假设一个变量$x\in W_1\cap W_2$,然后利用各子空间的性质得到在各子空间下的关于$x$的约束条件,然后在结合题目给的相关条件,证明$x=0$,然后就可以得到$W_1\cap W_2={0}$,即$W_1+W_2$为直和。

第二步,证明$W_1+ W_2=V^n$,

证明方法1:如果有给定或者能求出子空间的维数或者关于维数的约束时,可以利用公式$dim(V_1\cap V_2)=dimV_1 + dimV_2-dim(V_1+ V_2)$求出$dim(W_1+W_2)=n$

证明方法2:构造一个变量$x\in V^n$,其中$x=y+z$,$y\in W_1,z\in W_2$,说明上述情况后可以得到$V^n\subset W_1+W_2$,然后由子空间的性质可知$W_1+W_2\subset V^n$。所以可得$V^n = W_1+W_2$。再由上面已经证明$W_1+W_2$为直和,所以$V^n = W_1\oplus W_2$。

不变子空间

前面有
xxx

对称变换/正交变换

对称变换

正交变换

T在任一标准正交基下的矩阵为正交矩阵

其他

其他类型的证明题常用到的性质一般用到的就是关于维数特殊矩阵的性质。

各类矩阵的性质

待完成

1 正定矩阵

2 投影矩阵

是幂等矩阵

3 正交投影矩阵

(1)$A^2=A$(投影)

(2)$A^H=A$(正交)

(3)$\rho(A)=1$,谱半径为1

(4)$A^+=A$

4 HouseHolder矩阵

(1) $H^H=H$

(2)$H^HH=I$

(3)$H^2=I$(对合矩阵)

(4)$H^{-1}=H$(自逆矩阵)

(5)${ \begin{bmatrix}
I_r& 0\
0 & H\
\end{bmatrix} }$是n+r阶Householder矩阵

(6)$detH=-1$

5 givens矩阵

(1)givens矩阵是酉矩阵

(2)$detT=1$

6 酉矩阵

(1)若$A$是酉矩阵,则$A^{-1}$也是酉矩阵

(2)若$AB$是酉矩阵,则$AB$也是酉矩阵

(2)若$A$是酉矩阵,则$|detA|=1$

(4)$A\rightleftarrows A$的$n$个列向量是两两正交的单位向量,当$A$是实数构成的方阵时,酉矩阵就是正交矩阵($AA^T=I$)

7 Hermite矩阵

反Hermite矩阵:$A^H=-A$

Hermite矩阵的特征值均为实数,反Hermite矩阵的特征值为0或者纯虚数

8 列/行满秩矩阵

对应的$A^+$为:

列满秩矩阵:

(1)$A^+ = (A^HA)^{-1}A^H$

(2)$AA^+ = I_n$

行满秩矩阵:

(1)$A^+ = A^H(AA^H)^{-1}$

(2)$AA^+ = I_m$

9 $A^+$矩阵

(1)$(A^+)^+=A$

10 幂等矩阵

11 正规矩阵

包含酉矩阵,正交矩阵、Hermite矩阵、实对称矩阵、反Hermite矩阵、实反对称矩阵、对角矩阵等

12 度量矩阵

可逆


Author: star
Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint polocy. If reproduced, please indicate source star !
  TOC