
线性代数笔记(16)——正定矩阵、二次型和奇异值分解
正定矩阵
一些性质
如果 A 正定,A2,A−1 正定。
如果 A 正定,C 可逆,则 B=C−1AC 正定。
如果 A 正定,存在 C 使得 A=C2。
半正定矩阵
n 阶实对称阵,若 A 的特征值均大于 0,则称 A 是半正定矩阵。
半正定判别条件
- A 的所有特征值非负。
- xTAx≥0 对所有实向量 x 成立。
- 存在矩阵 R 使得 A=RTR。(R 可能是不可逆阵)
- A 的所有主子式均非负。
二次型
二次型
对 n 维实向量 x∈Rn 及 n 阶实对称阵,f(x)=xTAx 称为二次型。
复数域上变为共轭转置即可。
对角形
若 n 阶矩阵 D 为对角阵,则称二次型 f(x)=xTDx 为对角形的。
任何实二次型总可以经坐标变换 x=Qy 变为对角形。
主轴定理
设 A 是一个 n 阶实对称矩阵,则存在正交变量代换 x=Qy,使得二次型:
xTAx=yTΛy=n∑i=1λiy2i
变为对角形的二次型,其中 QTAQ=Λ=diag(λ1,⋯,λn),λ1,⋯,λn 为 A 的所有特征值。
推论:若 A 为 n 阶对称阵,则 xTAx=1 表示的图形为椭球面,半轴长相应为为 1√λi,λi 为其特征值。
平面上的有心二次曲线都可取到适当的直角坐标系,使其方程化为
标准形式:
λ1y21+λ2y22=1
二次型的分类
一个二次型 f(x)=xTAx:
- 正定的,若对所有 x≠0,有 f(x)>0;
- 负定的,若对所有 x≠0,有 f(x)<0;
- 不定的,若 f(x) 既有正值,又有负值;
- 半正定的,若对所有 x,有 f(x)≥0;
- 半负定的,若对所有 x,有 f(x)≤0。
定理:设 A 为 n 阶实对称阵,则二次型 f(x)=xTAx 是:
- 正定的 ⇔A 的所有特征值都是正数;
- 负定的 ⇔A 的所有特征值都是负数;
- 不定的 ⇔A 既有正特征值,又有负特征值。
矩阵的合同
设 C 是一个 n 阶非退化矩阵,则 x=Cy 称为变量 x=(x1,⋯,xn) 到 y=(y1,⋯,yn) 的非退化变量代换。
二次型 f(x)=xTAx(其中 A 为 n 阶对称阵)经可逆变量代换 x=Cy 变为:
xTAx=(Cy)TA(Cy)=yT(CTAC)y
记 B=CTAC,则 yTBy 是关于 y 的一个二次型,其矩阵为对称矩阵 B。
定义:两个 n 阶矩阵 A,B,若存在 n 阶可逆矩阵 C,使得:
CTAC=B
则称矩阵 A 与 B 合同,记为 A∼=B。
(此关系为等价关系)
主轴定理可表述为:任何实对称矩阵都正交合同于对角阵。
规范形与惯性定理
形如 z21+⋯+z2p–z2p+1–⋯–z2r 的二次型称为实二次型的规范形。
惯性定理:任意一个实二次型,总可经过一个适当的可逆线性替换,化成规范形,规范形是惟一的。
实二次型的规范形中,参数 p 和 r 是由二次型唯一确定的。
称 p 为实二次型的正惯性指数,r–p 为实二次型的负惯性指数。
p–(r–p)=2p–r 称为符号差。
证明:唯一性:
设实二次型 Q(α),作可逆线性替换 X=PZ,化成规范形。
Q(α)=z21+⋯+z2p–z2p+1–⋯–z2rX=(x1,x2,⋯,xn),Z=(z1,z2,⋯,zn)
作另一可逆线性替换 X=TU,化成规范形(其中 U=(u1,u2,⋯,un))
Q(α)=u1+⋯+u2q–u2q+1–⋯–u2r
假设 p<q。由 Z=P−1X,U=T−1X,设: zi=ai1x1+ai2x2+⋯+ainxnui=bi1x1+bi2x2+⋯+binxn
矛盾,故 p=q。
推论:任意实对称阵相合于:
(Ip−Ir–p0)
即若 A∈Mn(R),AT=A⇒∃ 可逆的 P∈Mn(R) 使得:
PTAP=(Ip−Ir–p0)
奇异值分解(SVD)
奇异值分解
Am×n 实矩阵,∃ 正交阵 Um×m,Vn×n,使得 A=UΣVT,其中 Σm×n=(σ1σ2⋱σr)。其中 r=rank(A),常取 σ1≥σ2≥⋯≥σr>0。
称 σ1,⋯,σr 为奇异值,称 U 和 V 的前 r 列向量为奇异向量。
证明:由 ATA 实对称且半正定,设 λ1≥⋯≥λr 为 ATA 的非零特征值。
设 v1,⋯,vr 是对应的特征向量,即 ATAvi=λivi(i=1,2,⋯,r) 且 ‖vi‖=1,vTivj=0(i≠j)。
(Avi)T(Avj)=vTiATAvj=vTiλjvj={0i≠jλji=j。
令 ui=Avi√λi 单位化,记 σi=√λi,i=1,2,⋯,r。
由 v1,v2,⋯,vr∈C(ATA)=C(AT),取 N(A) 的标准正交基 vr+1,⋯,vn。
由 u1,u2,⋯,ur∈C(A),取 N(AT) 的标准正交基 ur+1,⋯,um。
取 U=(u1,⋯,un),V=(v1,⋯,vm) 即可得证。
一些性质:
1. AAT 和 ATA 的特征值非负。
2. AAT 和 ATA 的非零特征值集合相同。
3. A=σ1u1vT1+⋯+σrurvTr。
m×n 阶阵 A 的伪逆
将 A 进行 SVD 分解。
定义 A 的伪逆为:
A+=V(σ−11σ−12⋱σ−1r)n×mUT
可以证明:Ax=b 的最小长度的最小二乘解为 A+b。
线性变换
定义
设 V,W 都是 R 上的线性空间,映射 σ:V→W 满足:
- ∀α,β∈V,都有 σ(α+β)=σ(α)+σ(β)。
- ∀k∈R,∀α∈V,都有 σ(kα)=kσ(α)。
称 σ 是 V 到 W 的一个线性变换。
设 dimV=n,dimW=m,设 v1,⋯,vn 是 V 的一组基,w1,⋯,wm 是 W 的一组基。
σ(v1,⋯,vn):=(σ(v1),⋯,σ(vn))=(w1,⋯,wm)A
称 A 是 σ 在输入基 v1,⋯,vn 到输出基 w1,⋯,wm 下对应的矩阵。
一个线性空间上两组基之间的线性变换对应的矩阵称为过渡矩阵。
No Comments