目錄:
-
-
- 一、從定義的角度進行解釋
- 二、從行(列)向量組的角度進行解釋
-
- 1. 行向量組
- 2.列向量組
- 三、複合線性映射
-
初識矩陣的乘法,就跟很多人一樣,将定義機械地記憶下來:
兩個矩陣相乘,要求前一個矩陣的列數和後一個矩陣的行數相等. 乘積矩陣的第 i i i 行第 j j j 列的元素等于前一個矩陣的第 i i i 個行向量與後一個矩陣的第 j j j 個列向量的内積(或點乘),用數學符号來描述就是:
假設有兩個矩陣 A = ( a i j ) m × n , B = ( b i j ) n × s A=(a_{ij})_{m\times n},\, B=(b_{ij})_{n\times s} A=(aij)m×n,B=(bij)n×s則
C = A B = ( c i j ) m × s C=AB=(c_{ij})_{m\times s} C=AB=(cij)m×s c i j = ∑ k = 1 n a i k b k j c_{ij}=\sum_{k=1}^{n}a_{ik}b_{kj} cij=k=1∑naikbkj
但矩陣乘法究竟該如何了解?下面給出我的答案:
一、從定義的角度進行解釋
最符合直覺的一種方式,即與定義最為接近的一種了解方式:
對 A \small A A 進行行分塊:
A = ( α 1 T α 2 T ⋮ α m T ) A= \begin{pmatrix} \alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_m^T \\ \end{pmatrix} A=⎝⎜⎜⎜⎛α1Tα2T⋮αmT⎠⎟⎟⎟⎞對 B \small B B 進行列分塊:
B = ( β 1 β 2 ⋯ β s ) B=\begin{pmatrix} \beta_1 \; \beta_2 \; \cdots \; \beta_s \\ \end{pmatrix} B=(β1β2⋯βs)則
C = ( α 1 T α 2 T ⋮ α m T ) ( β 1 β 2 ⋯ β s ) = ( α 1 T β 1 α 1 T β 2 ⋯ α 1 T β s α 2 T β 1 α 2 T β 2 ⋯ α 2 T β s ⋮ ⋮ ⋱ ⋮ α m T β 1 α m T β 2 ⋯ α m T β s ) C=\begin{pmatrix}\alpha_1^T \\ \alpha_2^T\\ \vdots \\ \alpha_m^T\end{pmatrix}(\beta_1\,\beta_2\,\cdots\,\beta_s)=\begin{pmatrix} \alpha_1^T\beta_1 & \alpha_1^T\beta_2 & \cdots & \alpha_1^T\beta_s \\ \alpha_2^T\beta_1 & \alpha_2^T\beta_2 & \cdots & \alpha_2^T\beta_s \\ \vdots & \vdots & \ddots & \vdots \\ \alpha_m^T\beta_1 & \alpha_m^T\beta_2 & \cdots & \alpha_m^T\beta_s \\ \end{pmatrix} C=⎝⎜⎜⎜⎛α1Tα2T⋮αmT⎠⎟⎟⎟⎞(β1β2⋯βs)=⎝⎜⎜⎜⎛α1Tβ1α2Tβ1⋮αmTβ1α1Tβ2α2Tβ2⋮αmTβ2⋯⋯⋱⋯α1Tβsα2Tβs⋮αmTβs⎠⎟⎟⎟⎞乘積矩陣 C \small C C 中的每個元素都是對應行向量與列向量的點乘.
現在逆向思維,将思路反過來.
已知向量 α = ( a 1 a 2 ⋯ a n ) T , β = ( b 1 b 2 ⋯ b n ) T \alpha=(a_1\,a_2\,\cdots\,a_n)^T,\beta=(b_1\,b_2\,\cdots\,b_n)^T α=(a1a2⋯an)T,β=(b1b2⋯bn)T,則兩者的點積為 ( α , β ) = ∑ i = 1 n a i b i (\alpha,\beta)=\sum_{i=1}^n a_ib_i (α,β)=i=1∑naibi可以寫作 ( α , β ) = ( a 1 a 2 ⋯ a n ) ( b 1 b 2 ⋮ b n ) = α T β (\alpha,\beta)=(a_1\,a_2\,\cdots\,a_n)\begin{pmatrix}b_1 \\ b_2 \\ \vdots \\ b_n\end{pmatrix}=\alpha^T\beta (α,β)=(a1a2⋯an)⎝⎜⎜⎜⎛b1b2⋮bn⎠⎟⎟⎟⎞=αTβ現在假設有一組向量 β 1 , β 2 , ⋯ , β s \beta_1,\beta_2,\cdots,\beta_s β1,β2,⋯,βs,按照這種排列構成一個矩陣 B = ( β 1 β 2 ⋯ β s ) \small B=(\beta_1\,\beta_2\,\cdots\,\beta_s) B=(β1β2⋯βs),則可以定義 α T \alpha^T αT 與矩陣 B \small B B 的乘法如下: α T B = α T ( β 1 β 2 ⋯ β s ) = ( α T β 1 α T β 2 ⋯ α T β s ) \alpha^T B=\alpha^T(\beta_1\,\beta_2\,\cdots\,\beta_s)=(\alpha^T\beta_1\,\alpha^T\beta_2\,\cdots\,\alpha^T\beta_s) αTB=αT(β1β2⋯βs)=(αTβ1αTβ2⋯αTβs)再假設有一組向量 α 1 , α 2 , ⋯ , α m \alpha_1,\alpha_2,\cdots,\alpha_m α1,α2,⋯,αm,則其與 B \small B B 的乘積定義如下:
令 A = ( α 1 T α 2 T ⋮ α m T ) A=\begin{pmatrix}\alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_m^T\end{pmatrix} A=⎝⎜⎜⎜⎛α1Tα2T⋮αmT⎠⎟⎟⎟⎞則 A B = ( α 1 T α 2 T ⋮ α m T ) ( β 1 β 2 ⋯ β s ) = ( α 1 T β 1 α 1 T β 2 ⋯ α 1 T β s α 2 T β 1 α 2 T β 2 ⋯ α 2 T β s ⋮ ⋮ ⋱ ⋮ α m T β 1 α m T β 2 ⋯ α m T β s ) AB=\begin{pmatrix}\alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_m^T\end{pmatrix}(\beta_1\,\beta_2\,\cdots\,\beta_s)=\begin{pmatrix} \alpha_1^T\beta_1 & \alpha_1^T\beta_2 & \cdots & \alpha_1^T\beta_s \\ \alpha_2^T\beta_1 & \alpha_2^T\beta_2 & \cdots & \alpha_2^T\beta_s \\ \vdots & \vdots & \ddots & \vdots \\ \alpha_m^T\beta_1 & \alpha_m^T\beta_2 & \cdots & \alpha_m^T\beta_s \\ \end{pmatrix} AB=⎝⎜⎜⎜⎛α1Tα2T⋮αmT⎠⎟⎟⎟⎞(β1β2⋯βs)=⎝⎜⎜⎜⎛α1Tβ1α2Tβ1⋮αmTβ1α1Tβ2α2Tβ2⋮αmTβ2⋯⋯⋱⋯α1Tβsα2Tβs⋮αmTβs⎠⎟⎟⎟⎞
二、從行(列)向量組的角度進行解釋
1. 行向量組
對 B \small B B 進行行分塊: B = ( β 1 T β 2 T ⋮ β n T ) B=\begin{pmatrix} \beta_1^T \\ \beta_2^T \\ \vdots \\ \beta_n^T \\ \end{pmatrix} B=⎝⎜⎜⎜⎛β1Tβ2T⋮βnT⎠⎟⎟⎟⎞ A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} A=⎝⎜⎜⎜⎛a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎠⎟⎟⎟⎞則
C = A B = ( a 11 β 1 T + a 12 β 2 T + ⋯ + a 1 n β n T a 21 β 1 T + a 22 β 2 T + ⋯ + a 2 n β n T ⋯ a m 1 β 1 T + a m 2 β 2 T + ⋯ + a m n β n T ) C=AB=\begin{pmatrix} a_{11}\beta_1^T+a_{12}\beta_2^T+\cdots+a_{1n}\beta_n^T \\ a_{21}\beta_1^T+a_{22}\beta_2^T+\cdots+a_{2n}\beta_n^T \\ \cdots \\ a_{m1}\beta_1^T+a_{m2}\beta_2^T+\cdots+a_{mn}\beta_n^T \end{pmatrix} C=AB=⎝⎜⎜⎛a11β1T+a12β2T+⋯+a1nβnTa21β1T+a22β2T+⋯+a2nβnT⋯am1β1T+am2β2T+⋯+amnβnT⎠⎟⎟⎞
即乘積矩陣 C \small C C 的每個行向量都是矩陣 B \small B B 行向量組的線性組合,第 i i i 個行向量的組合系數是矩陣 A \small A A 的第 i i i 行, i = 1 , 2 , ⋯ , m i=1,2,\cdots,m i=1,2,⋯,m.
是以,左乘一個矩陣就相當于對原矩陣進行了行變換.
2.列向量組
對 A \small A A 進行列分塊: A = ( α 1 α 2 ⋯ α n ) A=\begin{pmatrix}\alpha_1 \, \alpha_2 \, \cdots \, \alpha_n \end{pmatrix} A=(α1α2⋯αn) B = ( b 11 b 12 ⋯ b 1 s b 21 b 22 ⋯ b 2 s ⋮ ⋮ ⋱ ⋮ b n 1 b n 2 ⋯ b n s ) B=\begin{pmatrix} b_{11} & b_{12} & \cdots & b_{1s} \\ b_{21} & b_{22} & \cdots & b_{2s} \\ \vdots & \vdots & \ddots & \vdots \\ b_{n1} & b_{n2} & \cdots & b_{ns} \\ \end{pmatrix} B=⎝⎜⎜⎜⎛b11b21⋮bn1b12b22⋮bn2⋯⋯⋱⋯b1sb2s⋮bns⎠⎟⎟⎟⎞則
C = A B = ( b 11 α 1 + b 21 α 2 + ⋯ + b n 1 α n b 12 α 1 + b 22 α 2 + ⋯ + b n 2 α n ⋯ b 1 s α 1 + b 2 s α 2 + ⋯ + b n s α n ) C=AB=\\(b_{11}\alpha_1+b_{21}\alpha_2+\cdots+b_{n1}\alpha_n\,\,b_{12}\alpha_1+b_{22}\alpha_2+\cdots+b_{n2}\alpha_n \,\, \cdots \,\, b_{1s}\alpha_1+b_{2s}\alpha_2+\cdots+b_{ns}\alpha_n ) C=AB=(b11α1+b21α2+⋯+bn1αnb12α1+b22α2+⋯+bn2αn⋯b1sα1+b2sα2+⋯+bnsαn)
即乘積矩陣 C \small C C 的每個列向量都是矩陣 A \small A A 列向量組的線性組合,第 j j j 個列向量的組合系數是矩陣 B \small B B 的第 j j j 列, j = 1 , 2 , ⋯ , s j=1,2,\cdots,s j=1,2,⋯,s.
右乘一個矩陣就相當于對原矩陣進行了列變換.
三、複合線性映射
首先來說一下矩陣與線性映射的關系,用一句話來說就是,二者一一對應,即給定一個線性映射,可以唯一确定一個矩陣,反之亦然。下面進行解釋。
設 V 1 \small V_1 V1 是數域 P \small P P 上的 n n n 維線性空間, ϵ 1 , ϵ 2 , ⋯ , ϵ n \epsilon_1,\epsilon_2,\cdots,\epsilon_n ϵ1,ϵ2,⋯,ϵn 為 V 1 \small V_1 V1 的一組基, V 2 \small V_2 V2 是數域 P \small P P 上的 m m m 維線性空間, η 1 , η 2 , ⋯ , η m \eta_1,\eta_2,\cdots,\eta_m η1,η2,⋯,ηm 為 V 2 \small V_2 V2 的一組基, A \mathscr{A} A 是 V 1 \small V_1 V1 到 V 2 \small V_2 V2 的一個線性映射. 則 A ( ϵ i ) ∈ V 2 \small \mathscr{A}(\epsilon_i)\in V_2 A(ϵi)∈V2,可以由 η 1 , η 2 , ⋯ , η m \eta_1,\eta_2,\cdots,\eta_m η1,η2,⋯,ηm 線性表出,設 { A ( ϵ 1 ) = a 11 η 1 + a 21 η 2 + ⋯ + a m 1 η m A ( ϵ 2 ) = a 12 η 1 + a 22 η 2 + ⋯ + a m 2 η m ⋯ = ⋯ ⋯ A ( ϵ n ) = a 1 n η 1 + a 2 n η 2 + ⋯ + a m n η m \begin{cases} \mathscr{A}(\epsilon_1)=a_{11}\eta_1+a_{21}\eta_2+\cdots+a_{m1}\eta_m\\ \mathscr{A}(\epsilon_2)=a_{12}\eta_1+a_{22}\eta_2+\cdots+a_{m2}\eta_m\\ \quad\,\,\cdots\,=\cdots\cdots\\ \mathscr{A}(\epsilon_n)=a_{1n}\eta_1+a_{2n}\eta_2+\cdots+a_{mn}\eta_m\\\end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧A(ϵ1)=a11η1+a21η2+⋯+am1ηmA(ϵ2)=a12η1+a22η2+⋯+am2ηm⋯=⋯⋯A(ϵn)=a1nη1+a2nη2+⋯+amnηm表示為矩陣形式
A ( ϵ 1 , ϵ 2 , ⋯ , ϵ n ) = ( η 1 , η 2 , ⋯ , η m ) A \mathscr{A}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)=(\eta_1,\eta_2,\cdots,\eta_m)A A(ϵ1,ϵ2,⋯,ϵn)=(η1,η2,⋯,ηm)A其中 A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ] A=\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n}\\\vdots & \vdots & \ddots & \vdots\\a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} A=⎣⎢⎢⎢⎡a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎦⎥⎥⎥⎤ 因為 η 1 , η 2 , ⋯ , η m \eta_1,\eta_2,\cdots,\eta_m η1,η2,⋯,ηm 線性無關,是以組合系數唯一,可以由線性映射 A \small \mathscr{A} A 唯一确定矩陣 A \small A A.
另一方面,若已知矩陣 A \small A A,可以構造如上的線性映射. ∀ α ∈ V 1 \small \forall \, \alpha\in V_1 ∀α∈V1, α \alpha α 可以由 ϵ 1 , ϵ 2 , ⋯ , ϵ n \epsilon_1,\epsilon_2,\cdots,\epsilon_n ϵ1,ϵ2,⋯,ϵn 線性表出,設 α = k 1 ϵ 1 + k 2 ϵ 2 + ⋯ + k n ϵ n \alpha=k_1\epsilon_1+k_2\epsilon_2+\cdots+k_n\epsilon_n α=k1ϵ1+k2ϵ2+⋯+knϵn,根據映射的線性性 A ( α ) = A ( α ) = k 1 A ( ϵ 1 ) + k 2 A ( ϵ 2 ) + ⋯ + k n A ( ϵ n ) = A ( ϵ 1 , ϵ 2 , ⋯ , ϵ n ) ( k 1 k 2 ⋮ k n ) = ( η 1 , η 2 , ⋯ , η m ) A k ⃗ \begin{aligned}\mathscr{A}(\alpha)&=\mathscr{A}(\alpha)\\&=k_1\mathscr{A}(\epsilon_1)+k_2\mathscr{A}(\epsilon_2)+\cdots+k_n\mathscr{A}(\epsilon_n)\\&=\mathscr{A}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)\begin{pmatrix}k_1\\k_2\\\vdots\\k_n\end{pmatrix}\\&=(\eta_1,\eta_2,\cdots,\eta_m)A\vec{k}\end{aligned} A(α)=A(α)=k1A(ϵ1)+k2A(ϵ2)+⋯+knA(ϵn)=A(ϵ1,ϵ2,⋯,ϵn)⎝⎜⎜⎜⎛k1k2⋮kn⎠⎟⎟⎟⎞=(η1,η2,⋯,ηm)Ak 其中 A k ⃗ \small A\vec{k} Ak 為 m m m 維列向量,即 A ( α ) \small \mathscr{A}(\alpha) A(α) 在基 η 1 , η 2 , ⋯ , η m \eta_1,\eta_2,\cdots,\eta_m η1,η2,⋯,ηm 下的坐标. 故可以根據矩陣 A \small A A 唯一确定線性映射 A \small \mathscr{A} A.
是以,給定兩組基的情況下,矩陣與線性映射一一對應.
下面從複合線性映射的角度來了解矩陣乘法:
增設 V 3 \small V_3 V3 為數域 P \small P P 上的 s s s 維線性空間, ξ 1 , ξ 2 , ⋯ , ξ s \xi_1,\xi_2,\cdots,\xi_s ξ1,ξ2,⋯,ξs 為 V 3 \small V_3 V3 的一組基, B \small \mathscr{B} B 為 V 2 \small V_2 V2 到 V 3 \small V_3 V3 的一個線性映射,表示成矩陣形式 B ( η 1 , η 2 , ⋯ , η m ) = ( ξ 1 , ξ 2 , ⋯ , ξ s ) B \mathscr{B}(\eta_1,\eta_2,\cdots,\eta_m)=(\xi_1,\xi_2,\cdots,\xi_s)B B(η1,η2,⋯,ηm)=(ξ1,ξ2,⋯,ξs)B考慮複合映射 C = B ∘ A \mathscr{C}=\mathscr{B}\circ\mathscr{A} C=B∘A,則 C \small \mathscr{C} C 為 V 1 \small V_1 V1 到 V 3 \small V_3 V3 的線性映射,表示成矩陣形式
C ( ϵ 1 , ϵ 2 , ⋯ , ϵ n ) = ( ξ 1 , ξ 2 , ⋯ , ξ s ) C \mathscr{C}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)=(\xi_1,\xi_2,\cdots,\xi_s)C C(ϵ1,ϵ2,⋯,ϵn)=(ξ1,ξ2,⋯,ξs)C另一方面 C ( ϵ 1 , ϵ 2 , ⋯ , ϵ n ) = B ∘ A ( ϵ 1 , ϵ 2 , ⋯ , ϵ n ) = B ( η 1 , η 2 , ⋯ , η m ) A = ( B ( η 1 , η 2 , ⋯ , η m ) ) A = ( ξ 1 , ξ 2 , ⋯ , ξ s ) B A \begin{aligned}\mathscr{C}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)&=\mathscr{B}\circ\mathscr{A}(\epsilon_1,\epsilon_2,\cdots,\epsilon_n)\\&=\mathscr{B}(\eta_1,\eta_2,\cdots,\eta_m)A\\&=\big(\mathscr{B}(\eta_1,\eta_2,\cdots,\eta_m)\big)A\\&=(\xi_1,\xi_2,\cdots,\xi_s)BA\end{aligned} C(ϵ1,ϵ2,⋯,ϵn)=B∘A(ϵ1,ϵ2,⋯,ϵn)=B(η1,η2,⋯,ηm)A=(B(η1,η2,⋯,ηm))A=(ξ1,ξ2,⋯,ξs)BA由唯一性 C = B A C=BA C=BA
Plus: 如有錯誤、可以改進的地方、或任何想說的,請在評論區留言!