Skip to content

06 线性映射矩阵表示与矩阵运算基础

线性映射矩阵表示就是将线性映射 \(\sigma\) 出发空间的一组基 \(B_1\) 的像在到达空间的基 \(B_2\) 下的坐标表示按列排列得到的结果.

矩阵线性空间的同构

定理:线性映射与矩阵的同构

\(V_1\), \(V_2\) 分别是 \(n\) 维和 \(m\) 维线性空间,则 \(\mathcal{L}(V_1, V_2) \cong F^{m×n}\) 是同构的.

定理:线性映射对向量坐标的影响

\(\sigma \in \mathcal{L}(V_1, V_2)\) 关于 \(V_1\)\(V_2\) 的基 \(B_1\) 和基 \(B_2\) 的矩阵为 \(A = (a_{ij} )_{m×n}\),且 \(\alpha\)\(\sigma(\alpha)\) 在基 \(B_1 = (\alpha_1, \dots , \alpha_n)\)\(B_2 = (\beta_1, \dots , \beta_m)\) 下的坐标分别为 \(X\)\(Y\) ,则 \(Y = AX.\)

矩阵乘法

定义:矩阵乘法

\(A = (a_{ij} )_{p×m}, B = (b_{ij} )_{m×n}\),我们定义 \(A\)\(B\) 的乘积矩阵 \(C = AB = (c_{ij} )_{p×n}\) 是一个 \(p \times n\) 矩阵,其中它的第 \(i\) 行第 \(j\) 列元素为矩阵 \(A\) 的第 \(i\) 行与矩阵 \(B\) 的第 \(j\) 列对应位置元素相乘后求和的结果,即

\[ c_{ij} =\sum\limits_{k=1}^{m}a_{ik}b_{kj} = a_{i1}b_{1j} + a_{i2}b_{2j} + \dots + a_{im}b_{mj} (i = 1, \dots , p, j = 1, \dots , n). \]
矩阵乘法的性质
  1. \((AB)C = A(BC)\)(结合律)
  2. \(\lambda(AB) = (\lambda A)B = A(\lambda B), \lambda \in F\)
  3. \(A(B + C) = AB + AC\)(左分配律)
  4. \((B + C)P = BP + CP\)(右分配律)

假设矩阵 \(A = (a_{ij} )_{m×n}\)\(B = (b_{ij} )_{n×l}\) 相乘,我们有如下结论:

  1. 乘积的第 \(k\) 列等于 \(A\) 乘以 \(B\) 的第 \(k\) 列,乘积的第 \(j\) 行等于 \(A\) 的第 \(j\) 行乘以 \(B.\)
  2. 乘积的每一列都是矩阵 A 各列的线性组合,每一行都是矩阵 B 各行的线性组合.

注:

  1. 矩阵乘法不一定满足交换律,因此实数的完全平方公式代入矩阵不一定成立,即很多时候 \((A + B)^2 = A^2 + AB + BA + B^2 \neq A^2 + 2AB + B^2;\)
  2. 数量矩阵(即对角线上元素都相等,其余均为 0,单位矩阵是其特例)和任何同阶的矩阵相乘都是可交换的,这一点在矩阵求幂时很有用;
  3. \(A \neq O\)\(B \neq O\) 不能推出 \(AB \neq O\). 例如线性方程组 \(AX = 0\) 有非零解,若 \(B\) 的各列均为方程非零解,则 \(AB = O;\)
  4. 消去律也不一定满足:即 \(AB = AC\) 不一定 \(B = C\). 原因在于 \(AB = AC \Rightarrow A(B − C) = O\),由 (3) 可知不一定 \(B = C\).

矩阵的逆

定义:矩阵的逆

\(A \in M_n(F)\). 若存在 \(B \in M_n(F)\) 使得 \(AB = BA = E_n\)(不刻意强调时可以省略 \(n\) ),则称矩阵 \(A\) 可逆,并把 \(B\) 称为 \(A\)逆矩阵,记作 \(B = A^{−1}.\) 可逆矩阵也被称为非奇异矩阵,不可逆矩阵被称为奇异矩阵.

定理

可逆矩阵 \(A\) 的逆矩阵唯一.

定理

\(A, B \in M_n(F)\),则 \(AB = E \Leftrightarrow A\)\(B\) 互为逆矩阵. (即在定义的基础上可省略证明 \(A,B\) 可交换).

对于 \(n\times m\) 矩阵 \(A\)\(m\times n\) 矩阵 \(B\),若 \(AB = E\),则必有 \(B\) 的列向量线性无关. 作转置可得 \(B^TA^T = E\),则 \(A^T\) 的列向量线性无关,故 \(AB = E\) 还可以得到 \(A\) 的行向量线性无关.

基本性质
  1. 主对角元都是非零数的对角矩阵一定可逆,且逆矩阵就是对角线上元素取倒数(单位矩阵即为特例,其逆矩阵是其自身);

  2. 注意没有加法性质(例如 \(A\) 可逆(则 \(−A\) 也可逆),但 \(A + (−A) = O\) 不可逆),对于数乘有 \((\lambda A)^{−1} = \lambda^{-1}A^{−1}\)

  3. \((AB) ^{−1} = B^{−1}A^{−1}\) , \((A_1A_2 \dots A_k)^{-1} = A^{-1}_k \dots A^{-1}_2A^{−1}_1\)

(证明方法:直接验证相乘是否为单位矩阵,然后利用逆的唯一性)

  1. \((A^k )^{−1} = (A^{−1})^k , A^kA^m = A^{k+m}, (A^k )^m = A^{km}\);注意这里的 \(k\)\(m\) 不一定需要非负,事实上负数就是逆矩阵的幂次或幂次的逆,如 \(A^{−2} = (A^{−1})^2 = (A^2)^{−1}\)

  2. \(A\) 可逆,则消去律成立,即 \(AB = AC \Rightarrow B = C\) 成立,我们只需在 \(AB = AC\) 的等式两边同时左乘 \(A^{−1}\) 即可证明( \(BA = CA\) 的情况也是成立的,只需要等式两边同时右乘 \(A^{−1}\) 即可证明). 这个结论的一个显然的推论是,若 \(A\) 可逆且 \(AB = O\)(或 \(BA = O\))可以推出 \(B = O\)(令 \(C = O\) 即可).

矩阵的转置

基本性质
  1. \((A^T)^ T = A\)
  2. \((A + B)^ T = A^T + B^T\)
  3. \((\lambda A)^ T = \lambda A^T, \lambda \in F\)
  4. \((AB) ^T = B^TA^T,(A_1A_2 \cdots A_n) ^T = A^T_ n \cdots A^T _2 A^T _1 ,(A^T)^ m = (A^m) ^T\)
  5. \((A^T) ^{−1} = (A^{−1} )^ T\)
定义:对称矩阵与反对称矩阵

\(A = (a_{ij} )_{n×n}\),如果 \(\forall i, j \in \{1, 2, \dots , n\}\) 均有 \(a_{ij} = a_{ji}\),则称 \(A\) 为对称矩阵. 若均有 \(a_{ij} = −a_{ji}\),则称 \(A\) 为反对称矩阵.

由定义易知 \(A\) 为对称矩阵的充要条件为 \(A = A^T\)\(A\) 为反对称矩阵的充要条件为 \(A = −A^T\).

分块矩阵

定义:分块矩阵

一般地,对于 \(m\times n\) 矩阵 \(A\),如果在行的方向分成 \(s\) 块,在列的方向分成 \(t\) 块,就得到 \(A\) 的一个 \(s \times t\) 分块矩阵,记作 \(A = (A_{kl})_{s\times t}\),其中 \(A_{kl} (k = 1, \dots , s, l = 1, \dots , t)\) 称为 \(A\) 的子块.

分块矩阵的运算性质
  1. 分块矩阵的加法:设分块矩阵 \(A = (A_{kl})_{s\times t}\) , \(B = (B_{kl})_{s\times t}\) . 如果 \(A\)\(B\) 对应的子块 \(A_{kl}\)\(B_{kl}\) 都是同型矩阵,则
\[ A + B = (A_{kl} + B_{kl})_{s×t}$ . \]
  1. 分块矩阵的数乘:设分块矩阵 \(A = (A_{kl})_{s\times t}\)\(\lambda\) 是一个数,则
\[ \lambda A = (\lambda A_{kl})_{s\times t}. \]
  1. 分块矩阵的乘法:设 \(A = (a_{ij} )_{m\times n}, B = (b_{ij} )_{n\times p}\),如果把 \(A, B\) 分别分块为 \(r \times s\)\(s \times t\) 分块矩阵,且 \(A\) 的列分块法与 \(B\) 的行分块法相同(注意这些条件始终保证可乘性成立),则
\[ AB = \begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1s} \\ A_{21} & A_{22} & \cdots & A_{2s} \\ \vdots & \vdots & \ddots & \vdots \\ A_{r1} & A_{r2} & \cdots & A_{rs} \end{pmatrix} \begin{pmatrix} B_{11} & B_{12} & \cdots & B_{1t} \\ B_{21} & B_{22} & \cdots & B_{2t} \\ \vdots & \vdots & \ddots & \vdots \\ B_{s1} & B_{s2} & \cdots & B_{st} \end{pmatrix} = C = (C_{kl})_{r \times t} \]

其中 \(C\)\(r \times t\) 分块矩阵,且 \(C_{kl}\) 与一般矩阵计算类似,即为 \(A\)\(k\) 行块 \(B\)\(l\) 列块对应元素相乘后相加,即

\[ C_{kl} = A_{k1}B_{1l} + A_{k2}B_{2l} + \cdots + A_{ks}B_{sl}, k = 1, \dots , r, l = 1, \dots , t \]
  1. 分块矩阵的转置:大、小矩阵都要转置,这是分块矩阵与普通矩阵的一大性质差异;即 \(s \times t\) 分块矩阵 \(A = (A_{kl})_{s×t}\) 转置后 \(A^T = (B_{lk})_{t×s}\)\(t \times s\) 分块矩阵,且 \(B_{lk} = A^T _{kl}\).

例如

\[ \begin{pmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{pmatrix}^{\mathrm{T}} = \begin{pmatrix} A_{11}^{\mathrm{T}} & A_{21}^{\mathrm{T}} \\ A_{12}^{\mathrm{T}} & A_{22}^{\mathrm{T}} \end{pmatrix}. \]