
从 λ− 矩阵到整数矩阵的概念性质推广
§1 λ− 矩阵与整数矩阵 定义
A=(a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮an1an2⋯ann)
定义 设 P 是一个数域, λ是一个文字, 作多项式环 P[λ]. 一个矩阵, 如果它的元素是λ的多项式, 即 P[λ] 的元素, 就称为λ−矩阵.
定义 与 λ− 矩阵类似. 一个矩阵, 如果它的元素取自整数环Z, 就称为整数矩阵.
我们之前的学习过程中主要接触的是数字矩阵, 即以数域 P 中数作为元素的矩阵.
而λ−矩阵可以看作数字矩阵的推广, 整数矩阵也是数字矩阵中的一种特殊矩阵, 因此我们考虑比较他们的各类性质的异同, 将λ−矩阵的性质尝试推广至整数矩阵, 在下面的内容中逐项进行分析.
对于矩阵中元素的加、减、乘运算, 整数矩阵和数字矩阵同样有着完全相同的运算规律.
因此对整数矩阵的加法乘法我们可以给出同样的定义, 矩阵的行列式的定义亦复如是, 这里不再赘述了.
对于子式的定义类似:
定义1 如果整数矩阵 A 中有一个 r(r⩾1) 级子式不为零, 而所有 r+1 级子式(如果有的话)全为零, 则称 A 的秩为 r. 零矩阵的秩规定为零.
对于矩阵的逆的定义类似:
定义2 一个 n×n 的整数矩阵 A 称为是可逆的, 如果有一个 n×n 的整数矩阵 B 使得
AB=BA=E
则适合上式的矩阵 B 称为 A 的逆矩阵, 记为 A−1.
然后讨论逆矩阵的存在性, 由数字矩阵中伴随矩阵的内容, 我们已经知道
AA∗=A∗A=dE
其中 d=|A|.
那么当 d≠0 时, 我们需要考虑 1dA∗ 是否为整数矩阵, 只要它是整数矩阵我们就可以得到 A 是可逆的, 反之则不可逆; 而当 d=0 时从数字矩阵的角度考虑 A 已经是不可逆的, 作为整数矩阵自然一定不可逆.
若 1dA∗ 为整数矩阵, 则 A∗ 中所有元素都能够被d整除, 此时我们可以得出:
当 d=±1 时, 原矩阵的逆是一定存在的;
当 d≠±1 时, 若 A−1 存在,则 |AA−1|=|A||A−1|=|E|=1, 又因为整数矩阵的行列式都是整数元素的加减乘运算, 其运算结果也必然是整数.
此时 |A|≠±1 且 |A−1|∈Z 与 |A||A−1|=1 矛盾.
所以 d≠±1 时原矩阵 A 不可逆.
综上所述我们可以得到:
定理1 一个 n×n 的整数矩阵 A 可逆的充分必要条件为行列式 |A|=±1.
§2 初等变换 等价(相抵)关系
下面的三种变换叫做λ−矩阵的初等变换:
- 矩阵的两行(列)互换位置;
- 矩阵的某一行(列)乘非零的常数 c ;
- 矩阵的某一行(列)加另一行(列)的 φ(λ) 倍, φ(λ) 是一个多项式.
定义3 同样的,我们可以给出整数矩阵的初等变换:
- 矩阵的两行(列)互换位置;
- 矩阵的某一行(列)乘 −1;
- 矩阵的某一行(列)加另一行(列)的整数倍.
注意到这里对于 2 的定义: 为了保持初等矩阵的可逆性质, 这里不能再乘以非零常数 c 而只能选择 ±1, 乘以 1 时所得就是原矩阵, 因此这里将 2 推广时只保留乘 −1 这种情况.
对于 3 的定义: 当然如果只是要保持整数矩阵到整数矩阵的映射, 当某一行(列)有不为1的最大公因数 q 时, 对于任意非零整数 N, 这一行(列)乘以 Nq 后的矩阵仍是整数矩阵.
但这样定义的初等变化不具有普遍的性质, 因此这里我们考虑将初等变换定义为乘以非零整数.
对此再作一些补充说明: 不同于数字矩阵或是λ−矩阵, 整数矩阵的初等变换往往有较多种形式, 只是考虑到之后所需要的性质, 为了证明方便采取这样的定义.
如果是要求整数矩阵中元素的最大公因数等情况, 往往会对 2、3 采取不同的定义.
同理我们可以引入初等矩阵, 即由单位矩阵经过一次初等变换得到的整数矩阵.
同样的,对于一个 s×n 的整数矩阵A作一次初等行变换就相当于左乘对应的 s×s 初等矩阵, 作一次初等列变换就相当于右乘了对应的 n×n 初等矩阵.
同时由上面关于逆的讨论我们还可以得到初等矩阵都是可逆的的结论.
定义4 整数矩阵 A 称为与整数矩阵 B 等价, 如果可以经过一系列初等变换将 A 化成 B.
显然这里定义的整数矩阵的等价关系具有自反性、对称性、传递性,不再赘述.
应用初等变换与初等矩阵的关系, 矩阵 A 与 B 等价的充分必要条件为有一系列的初等矩阵 P1,P2,⋯,Pl,Q1,Q2,⋯,Qt 使得
A=P1P2⋯PlBQ1Q2⋯Qt
§3 标准形
有了上面的铺垫, 我们来证明任意一个整数矩阵可以经过初等变换化为某种对角形.
为此先给出一个引理.
引理 设整数矩阵 A 的左上角元素 a11≠0, 并且 A 中至少有一个元素不能被它整除, 那么一定可以找到一个与 A 等价的矩阵 B, 它的左上角元素 b11 也不为零, 但是有 b11<a11.
证明 根据 A 中不能被 a11 整除元素所在位置分三种情况讨论.
- A 的第一行中有一个元素 a1i(i≠1) 不能被 a11 整除,则有
a1i=qa11+r
这里 r≠0 且 r<a11.那么对 A 作初等列变换, 把第 i 列减去第一列的 q 倍,再互换第一列与第 i 列. 这样新得到的矩阵即符合引理中对于 B 的要求. A 的第一列中有一个元素 ai1(i≠1) 不能被 a11 整除, 这种情况与 1 同理, 作初等行变换即可.
- A 的第一行第一列中元素均可被 a11 整除,但 A 中元素 aij(i>1,j>1) 不能被 a11 整除,此时设 ai1=ka11, 考虑对 A 作如下的变换:
A=(a11⋯a1j⋯⋮⋮⋮ai1⋯aij⋯⋮⋮⋮)⟶(a11⋯a1j⋯⋮⋮⋮0⋯aij−ka1j⋯⋮⋮⋮)⟶(a11⋯a1j+aij−ka1j⋯⋮⋮⋮0⋯aij−ka1j⋯⋮⋮⋮)=B
此时矩阵 B 中, 第一行的元素 (1−k)a1j+aij 不能被左上角元素 a11 整除, 化为了 1 中的情况.
综上所述, 可以得到引理成立.
定理2 任意一个非零的 s×n 整数矩阵 A 都等价于下列形式的整数矩阵:
(d1d2⋱dr0⋱0)
其中 d1,d2,⋯,dr 均为正整数且 di|di+1 (i=1,2,⋯,r−1).
证明 与 λ− 矩阵的证明类似.
经过行列调动后,可以使得 A 的左上角元素 a11≠0,再通过初等变换2)可以确保 a11>0.
此时若 a11不能整除 A 中所有元素, 由引理可以找到与A等价且左上角元素 b11<a11 的矩阵 B1, 但左上角元素一定大于等于1.因此这样的步骤重复有限次后就可以最终得到整数矩阵 Bs, 它的左上角元素 b11>0 且可以整除 Bs 中所有元素,对 Bs 作一系列初等变换可得:
Bs=(bs⋯b1j⋯⋮⋮⋮bi1⋯⋯⋯⋮⋮⋮)⟶(bs0⋯00⋮A10)
这里的矩阵 A1 中的所有元素都是 Bs 中元素的组合, 可以被 bs 整除.
如果 A1≠O, 则 A1 可以重复上述过程, 进而把矩阵化成以下形状, 且 d1|d2.
(d10⋯00d2⋯000⋮⋮A200)
重复这样的操作, 最后就可以化出所要求的形状, 将最后化得的矩阵称为 A 的标准形.
§4 行列式因子 不变因子
同样的, 下面我们考虑证明标准型的唯一性.
定义5 设整数矩阵 A 的秩为 r, 则对于正整数 k(1⩽k⩽r), A 中必有非零的 k 级子式. A 中全部 k 级子式的最大公因数称为 A 的k 级行列式因子.
秩为 r 的整数矩阵 A 有 r 个行列式因子, 且根据定义我们可知, 它在初等变换下是不变的.
定理3 等价的整数矩阵具有相同的秩与相同的各级行列式因子.
证明 考虑证明初等变换不改变整数矩阵 A 的秩与行列式因子即可.
设整数矩阵 A 经过一次初等行变换后变为 B, f(k) 与 g(k) 分别是 A 与 B 的 k 级行列式因子.
然后根据所作的变换分三种情况进行讨论.
- A 经过第一种初等行变换变为 B. 此时对于 B 中任意 k 级子式, 必然等于 A 中某个 k 级子式或者与其反号.
因此 f(k) 一定是 B 的 k 级子式的公因数, 我们有 f(k)|g(k).
A 经过第二种初等行变换变为 B. 此时与 1 中情况相似, 对于 B 中任意 k 级子式, 必然等于 A 中某个 k 级子式或者与其反号.
因此 f(k) 一定是 B 的 k 级子式的公因数, 我们有 f(k)|g(k).
A 经过第三种初等行变换变为 B. 设第 i 行加上第 j 行的 n 倍. 此时 B 中所有包含第 i 行与 j 行的 k 级子式和不包含第 i 行的 k 级子式都与 A 中对应子式相等.
而对于 B 中包含第 i 行但不包含第 j 行的 k 级子式, 按第二行分成两部分, 即 A 中的第 i 行与加上的第 j 行的 n 倍, 此时该 k 级子式即为 A 中两个 k 级子式的和.
因此 f(k) 一定是 B 的 k 级子式的公因数, 可以得到 f(k)|g(k).
对于初等列变换, 可以按上述步骤完全相同地讨论.
于是我们可以得到结论, 若整数矩阵 A 经过一次初等行(列)变换后变为 B, 那么 f(k)|g(k).
又由初等变换的可逆性, 整数矩阵 B 同样可以经过一次初等行(列)变换后变为 A, 那么同样的我们可以得到 g(k)|f(k).
综上所述, 我们可以得到 f(k)=g(k).
当 A 的全部 k 级子式为零时, B 的 k 级子式也全部为零; 反之亦然.因此还可以得到 A 与 B 的秩也相同.
下面来计算标准形矩阵的行列式因子, 设标准形为
(d1d2⋱dr0⋱0)
其中 d1,d2,⋯,dr 均为正整数且 di|di+1(i=1,2,⋯,r−1).
对于某个 k 级子式, 如果它包含的行与列的标号不完全相同, 那么这个子式一定为零.
因此只需要考虑行与列标号相同的 k 级子式, 此时这个 k 级子式等于 k 个对角线上元素 di 的乘积, 由 d 的性质, 显然这些 k 级子式的公因数为
d1d2⋯dk
定理4 整数矩阵的标准形是唯一的.
证明 设上面的 (1) 是整数矩阵 A 的标准形, 则 A 与 (1) 等价, 他们具有相同的秩和行列式因子.
因此 A 的秩就是标准形的主对角线上非零元素的个数 r, A 的 k 级行列式因子就是
Dk=d1d2⋯dk(k=1,2,⋯,r)
于是
d1=D1,d2=D2D1,⋯,dr=DrDr−1
这说明 A 的标准形 (1) 的主对角线上的非零元素是被 A 的行列式因子所唯一决定的, 所以 A 的标准形是唯一的.
定义6 标准形的主对角线上非零元素 d1,d2,⋯,dr 称为整数矩阵 A 的不变因子.
定理5 两个整数矩阵等价的充分必要条件是它们有相同的行列式因子, 或者它们有相同的不变因子.
证明 在定理 4 的 (2)(3) 中我们已经得到了整数矩阵的行列式因子和不变因子的关系, 这个关系式表明行列式因子和不变因子是相互确定的.
因此,有相同的行列式因子和有相同的不变因子是等价的.
必要性已由定理 3 证明.
充分性,若整数矩阵 A 与 B 有相同的不变因子,则 A 与 B 和同一个标准形等价, 因此 A 与 B 等价.
在整数矩阵的行列式因子之间, 有关系
Dk|Dk+1(k=1,2,⋯,r−1)
在计算一个整数矩阵的行列式因子时, 我们往往先计算最高级的行列式因子, 这样通过上式我们可以大致得到低级行列式因子的范围.
下面以可逆矩阵的标准形为例.
设 A 是一个 n×n 的可逆矩阵, 由定理 1 可知
Dn=|A|=1
于是由(4)可知
Dk=1(k=1,2,⋯,n)
从而有
dk=1(k=1,2,⋯,n)
因此可逆矩阵的标准形是单位矩阵 E.
反过来,与单位矩阵等价的整数矩阵一定是可逆的, 因为它的行列式为 ±1.
也就是说整数矩阵可逆的充分必要条件是它与单位矩阵等价.
又因为整数矩阵 A 与 B 等价的充分必要条件是有一系列初等矩阵 P1,P2,⋯,Pl,Q1,Q2,⋯,Qt 使得
A=P1P2⋯PlBQ1Q2⋯Qt
特别的, 当 B=E 时, 就得到:
定理6 整数矩阵 A 是可逆的充分必要条件是它可以表示成一些初等矩阵的乘积.
由此又得到矩阵等价的另一条件:
推论 两个 s×n 的整数矩阵 A 与 B 等价的充分必要条件为, 有一个 s×s 的可逆整数矩阵 P 与一个 n×n 的可逆整数矩阵 Q, 使得
B=PAQ
§5 初等因子
定义7 把整数矩阵 A 的每个不等于 1 的不变因子进行质因数分解, 所有这些素因子(相同的按出现的次数计算)称为矩阵 A 的初等因子.
下面进一步的说明不变因子和初等因子的关系.
假设整数矩阵 A 的不变因子 d1,d2,⋯,dr 已知.
将 di(i=1,2,⋯,r) 进行分解成互不相同的质数的方幂的乘积:
d1=pk111pk122⋯pk1mm,d2=pk211pk222⋯pk2mm,⋯⋯dr=pkr11pkr22⋯pkrmm
则其中对应于 kij⩾1 的那些方幂
pkijj(kij⩾1)
就是A的全部初等因子.
我们注意到不变因子有一个整除一个的性质: di|di+1(i=1.2,⋯,r−1).
因此我们可以得到:
pkijj|pki+1,jj(i=1,2,⋯,r−1;j=1,2,⋯,m)
因此在对 di 的分解中, 属于同一个素因子的方幂的指数是递增的,即满足:
k1j⩽k2j⩽⋯⩽krj(j=1,2,⋯,m)
这说明, 在同一个素因子的方幂作成的初等因子中, 次数最高的必定出现在 dr 的分解之中,次数次高的必定出现在 dr−1 的分解之中.
以此类推, 可知属于同一个素因子的方幂的初等因子在不变因子的分解式中出现的位置是唯一确定的.
通过上面的分析我们可以得到一个从初等因子和矩阵的秩唯一作出不变因子的方法.
设整数矩阵 A 的秩为 r, 它的全部初等因子已知, 则在全部初等因子中将同一个素因子 pi 的方幂的初等因子按照降幂排列, 而当这些初等因子个数不足 r 个时, 就在后面补上适当个数的 1 使得个数为 r, 于是得到排列:
pkrjj,pkr−1,jj,⋯,pk1,jj(j=1,2,⋯,m)
此时令
di=pki11pki22⋯pkimm(i=1,2,⋯,r)
所得的 d1,d2,⋯dr 即为 A 的不变因子.
也由此我们可以得到两个整数矩阵若有相同的不变因子则有相同的初等因子, 同样的若有相同的初等因子则有相同的不变因子.
综上所述, 我们可以得到:
定理8 两个整数矩阵等价的充分必要条件是他们有相同的初等因子.
这里我们无法像 λ− 矩阵那样得到复数矩阵的结论, 因为在讨论整数矩阵时我们并没有特征矩阵的定义.
同时我们注意到: 相比λ−矩阵, 对于整数矩阵定义初等因子其实意义并不大, 因为我们难以将特征矩阵的概念作类似的推广, 也不能用它为若尔当标准形唯一性的证明服务.
但为了相关定义推广的完整性以及有时能简化运算, 仍然给出一些本节定理的推广.
类似多项式最大公因式, 给出整数最大公因数的一个性质:
如果整数 a,b 都与 c,d 互素, 则 (ac,bd)=(a,b)(c,d).
设 (ac,bd)=d,(a,b)=d1,(c,d)=d2.
此时显然有 d1|d,d2|d, 而(a,c)=1, 故 (d1,d2)=1, 由此可得 d1d2|d.
另一方面, 由于 d|ac, 可以令 d=a1c1, 其中 a1|a,c1|c.
由于 (a,d)=1, 故 (a1,d)=1.
由a1|bd 可得 a1|b, 因而a1|d1, 同理可得 c1|d2.
因此 d|d1d2, 综上, d=d1d2.
引理 设整数矩阵
A=(ac00bd)B=(bc00ad)
如果a,b 都与 c,d 互素, 则 A 与 B 等价.
显然 A 与 B 有相同的二级行列式因子.
而 A 与 B 的一级行列式因子分别为 (ac,bd) 与 (bc,ad).
由上面的讨论可知两者相等, 因此 A 与 B 等价.
定理9 整数矩阵 A 若与对角形整数矩阵
B=(b1b2⋱bi⋱)
等价, 则把每个不为零的 bi 分解为质因数的乘积, 得到的全部素因子, 相同的按出现的次数记录, 恰好构成 A 的初等因子集合.
证明 不妨设 b1,b2,⋯,br 是主对角线上的全部非零元素(否则可通过适当的交换行列变换化成这种形式), r 即为矩阵 B 的秩.
设
bi=pki11pki22⋯pkiss(i=1,2,⋯,r)
令
ci=pki22⋯pkiss(i=1,2,⋯,r)
则有
bi=pki11ci(i=1,2,⋯,r)
且每个 pki11 都与 cj(j=1,2,⋯,r) 互素.
此时,若 k11,k21,⋯,kr1 不是从小到大排列的, 不妨设 k11>k21, 根据引理结论可得以下两矩阵等价:
(pk111c100pk211c2)(pk211c100pk211c2)
从而 B 与对角矩阵
B1=(pk211c1pk111c2⋱pkr11cr⋱)
等价.然后再对 B1 作如上的讨论.
如此继续进行, 直到对角矩阵主对角线上元素所含 p1 的方幂是按幂次升序排列为止.
依次对 p2,⋯,pr 作同样处理, 最后便得到与 B 等价的对角矩阵 B′, 它的主对角线上所含每个相同的素因子的方幂都是按幂次的升序排列的.
此时 B′ 就是矩阵 A 的标准形并且所有 pkijj 就是 A 的全部初等因子.
参考资料:《高等代数(第四版)》(北京大学数学系前代数小组 编 王萼芳 石生明 修订)
Comments: 1
lyk 发文了,爷青结!