Aerospace Kim

[선형변환부터 동형사상까지] ch4. 선형변환의 합성과 행렬 곱

  이전 읽을거리 : [선형변환부터 동형사상까지] ch3. 선형변환의 행렬표현

  다음 읽을거리 : [선형변환부터 동형사상까지] ch5. 행렬 연산

 

  본 포스팅은 '프리드버그 선형대수학(5판)'을 공부하며 작성하였습니다.

 

 

6. 선형변환의 합성

 

  함수의 합성에 대해서는 0.3. 합성함수를 보고 오는 것이 좋다.

 

  두 함수 $f,\;g$ 의 합성을 표기할 때 $g\circ f$ 라고 쓰는 것이 일반적이다. 그러나 선형대수학에서는 표기에 일관성을 돋보이게 하기 위해, 두 선형변환 $T,\;U$ 의 합성을 $UT$ 라고 간단하게 표기한다.

 

  다음 정리에 따르면, 선형변환의 합성은 여전히 선형이다.

 

정리 6-1)  $F$-벡터공간 $V,\;W,\;Z$ 와 선형변환 $T:V\to W$ , $U:W\to Z$ 를 생각하자. 두 선형변환의 합성 $UT:V\to Z$ 는 선형변환이다.

 

proof)

  임의의 벡터 $x,\;y\in V$ 와 스칼라 $c\in F$ 에 대하여 다음이 성립한다.

$$\begin{align}UT(cx+y)=&U(T(cx+y))\\=&U(cT(x)+T(y))\\=&cU(T(x))+U(T(x))\\=&c(UT)(x)+UT(y)\end{align}$$

  따라서 $UT$ 는 선형이다.   $\square$

 

 

  다음은 선형변환의 합성에 대한 중요한 성질이다.

 

정리 6-2)  $F$-벡터공간 $V,\;W,\;Z$ 와 임의의 선형변환 $T,\;T_1,\;T_2\in\mathcal{L}(V,W)$ , $U,\;U_1,\;U_2\in\mathcal{L}(W,Z)$ 에 대하여 다음이 성립한다.
  (ⅰ) $U(T_1+T_2)=UT_1+UT_2$
  (ⅱ) $(U_1+U_2)T=U_1T+U_2T$
  (ⅲ) $TI_V=I_WT=T$
  (ⅳ) 임의의 스칼라 $a\in F$ 에 대하여, $a(UT)=(aU)T=U(aT)$

 

proof)

  (ⅰ) : 임의의 벡터 $x\in V$ 에 대하여 다음이 성립한다.

$$\begin{align}\Big(U(T_1+T_2)\Big)(x)=&U\Big((T_1+T_2)(x)\Big)\\=&U(T_1(x)+T_2(x))\\=&U(T_1(x))+U_1(T_2(x))\\=&UT_1(x)+UT_2(x)\\=&(UT_1+UT_2)(x)\end{align}$$

  따라서 $U(T_1+T_2)=UT_1+UT_2$ 이다.

 

  (ⅱ) : 임의의 벡터 $x\in V$ 에 대하여 다음이 성립한다.

$$\begin{align}\Big((U_1+U_2)T\Big)(x)=&(U_1+U_2)(T(x))\\=&U_1(T(x))+U_2(T(x))\\=&U_1T(x)+U_2T(x)\\=&(U_1T+U_2T)(x)\end{align}$$

  따라서 $(U_1+U_2)T=U_1T+U_2T$ 이다.

 

  (ⅲ) : 임의의 벡터 $x\in V$ 에 대하여 다음이 성립한다.

$$TI_V(x)=T(I_V(x))=T(x)$$

$$I_WT(x)=I_W(T(x))=T(x)$$

  따라서 $TI_V=I_WT=T$ 이다.

 

  (ⅳ) : 임의의 벡터 $x\in V$ 에 대하여 다음이 성립한다.

$$\begin{align}\Big((aU)T\Big)(x)=&(aU)(T(x))\\=&aU(T(x))\\=&a(UT)(x)\\=&\Big(a(UT)\Big)(x)\end{align}$$

$$\begin{align}\Big(U(aT)\Big)(x)=&U\Big((aT)(x)\Big)\\=&U(aT(x))\\=&aU(T(x))\\=&a(UT)(x)\\=&\Big(a(UT)\Big)(x)\end{align}$$

  따라서 $a(UT)=(aU)T=U(aT)$ 이다.   $\square$

 

 

  참고로 선형변환도 어디까지나 함수의 일종이기 때문에, 정리 0.3-1과 같이 합성에 대한 교환법칙 $R(UT)=(RU)T$ 가 성립한다.

 

  정의역과 공역이 같은 벡터공간인 선형변환의 경우, 동일한 선형변환을 여러 번 합성할 수 있다. 이러한 경우 다음의 편리한 표기법을 이용하자.

 

정의)  벡터공간 $V$ 와 선형사상 $T\in\mathcal{L}(V)$ 를 생각하자. $T^1:=T$ 라 정의하며, 2 이상의 자연수 k에 대하여 $T^k:=T^{k-1}T$ 로 정의한다. 편의상 $T^0=I_V$ 로 정의한다.

 

  마지막에 $T^0=I_V$ 로 정의한 것은, 식 $T^k=T^{k-1}T$ 의 k에 1을 대입하면 $T^1=T^0T$ 를 얻으므로 합리적인 정의라고 할 수 있다.

 

 

7. 행렬 곱

 

  이 글을 찾아온 분들은 두 행렬의 곱이 어떻게 정의되는지 알것이다. 하지만 행렬 곱이 왜 그렇게 정의되는지 모르는 분들도 분명히 있으리라. 아래에선 행렬 곱이 만족해야 하는 조건으로부터 그 정의되는지를 유도한다.

 

  유한차원 $F$-벡터공간 $V,\;W,\;Z$ 각각의 순서기저 $\alpha=\{v_1,\ldots,v_n\}$ , $\beta=\{w_1,\ldots,w_m\}$ , $\gamma=\{z_1,\ldots,z_p\}$ , 선형변환 $T:V\to W$ , $U:W\to Z$ 과 두 선형변환의 합성 $UT$ 를 생각하자. 세 행렬 $[T]_\alpha^\beta\in\mathbb{M}_{m\times n}(F)$ , $[U]_\beta^\gamma\in\mathbb{M}_{p\times m}(F)$ , $[UT]_\alpha^\gamma\in\mathbb{M}_{p\times m}(F)$ 에 대하여 다음 식이 성립하도록 행렬 곱을 정의할 것이다.

$$[U]_\beta^\gamma[T]_\alpha^\beta:=[UT]_\alpha^\gamma\tag{7-1}$$

  행렬표현의 정의로부터 다음이 성립한다.

$$\begin{gather}T(v_j)=\sum_{k=1}^m\Big([T]_\alpha^\beta\Big)_{kj}w_k\\\mbox{for }j=1,\ldots,n\end{gather}\tag{7-2}$$

$$\begin{gather}U(w_k)=\sum_{i=1}^p\Big([U]_\beta^\gamma\Big)_{ik}z_i\\\mbox{for }k=1,\ldots,m\end{gather}\tag{7-3}$$

$$\begin{gather}UT(v_j)=\sum_{i=1}^p\Big([UT]_\alpha^\gamma\Big)_{ij}z_i\\\mbox{for }j=1,\ldots,n\end{gather}\tag{7-4}$$

  식 (7-2)와 식 (7-3)을 종합하면 다음의 결과를 얻을 수 있다.

$$\begin{align}&\quad UT(v_j)\\&=U(T(v_j))\\&=U\left(\sum_{k=1}^m\Big([T]_\alpha^\beta\Big)_{kj}w_k\right)\\&=\sum_{k=1}^m\Big([T]_\alpha^\beta\Big)_{kj}U(w_k)\\&=\sum_{k=1}^m\Big([T]_\alpha^\beta\Big)_{kj}\Big(\sum_{i=1}^p\Big([U]_\beta^\gamma\Big)_{ik}z_i\Big)\\&=\sum_{i=1}^p\left\{\sum_{k=1}^m\Big([U]_\beta^\gamma\Big)_{ik}\Big([T]_\alpha^\beta\Big)_{kj}\right\}z_i\tag{7-5}\end{align}$$

  식 (7-4)와 식 (7-5)를 종합하면, $z_1,\ldots,z_p$ 가 일차독립이라는 사실로부터 모든 $i=1,\ldots,p$ , $j=1,\ldots,n$ 에 대하여 다음이 성립한다.

$$\Big([UT]_\alpha^\gamma\Big)_{ij}=\sum_{k=1}^m\Big([U]_\beta^\gamma\Big)_{ik}\Big([T]_\alpha^\beta\Big)_{kj}$$

  앞서 행렬 곱이 만족해야 하는 조건으로서 식 (7-1)을 고정하였으므로 다음 식이 성립하여야 한다.

$$\Big([U]_\beta^\gamma[T]_\alpha^\beta\Big)_{ij}=\sum_{k=1}^m\Big([U]_\beta^\gamma\Big)_{ik}\Big([T]_\alpha^\beta\Big)_{kj}$$

  이로서 모두 알고있는 다음의 정의에 명분이 생긴다.

 

정의)  $p\times m$ 행렬 $A$ 와 $m\times n$ 행렬 $B$ 를 생각하자. 두 행렬 $A,\;B$ 의 곱(product) $AB$ 는 다음과 같이 정의된 $p\times n$ 행렬이다.$$\begin{gather}(AB)_{ij}=\sum_{k=1}^mA_{ik}B_{kj}\\\mbox{for }1\le i\le p,\;1\le j\le n\end{gather}$$

 

  그리고 다음의 정리는 행렬 곱의 정의가 만족해야하는 공리로서 자명한 사실이다. 혹은 행렬 곱의 정의로부터 거꾸로 유도해낼 수도 있다.

 

정리 7-1)  유한차원 벡터공간 $V,\;W,\;Z$ 와 각각의 순서기저 $\alpha,\;\beta.\;\gamma$ , 선형변환 $T:V\to W$ , $U:W\to Z$ 에 대하여 다음이 성립한다.$$[UT]_\alpha^\gamma=[U]_\beta^\gamma[T]_\alpha^\beta$$

 

  정리 7-1에서 순서기저 $\gamma=\beta$ 일 경우 정리의 결론은 $[UT]_\beta=[U]_\beta[T]_\beta$ 로 쓰여진다.

 

  예로, 다음의 두 선형변환을 생각하자.

$$U:\mathbb{P}_3(\mathbb{R})\to \mathbb{P}_2(\mathbb{R}),\;f(x)\mapsto f'(x)$$

$$T:\mathbb{P}_2(\mathbb{R})\to \mathbb{P}_3(\mathbb{R}),\;f(x)\mapsto\int_0^xf(t)dt$$

  $\mathbb{P}_3(\mathbb{R}),\; \mathbb{P}_2(\mathbb{R})$ 의 표준 순서기저 $\alpha,\;\beta$ 에 대하여 다음과 같음을 계산해볼 수 있다.

$$[U]_\alpha^\beta=\begin{pmatrix}0&1&0&0\\0&0&2&0\\0&0&0&3\end{pmatrix}$$

$$[T]_\beta^\gamma=\begin{pmatrix}0&0&0\\1&0&0\\0&\frac{1}{2}&0\\0&0&\frac{1}{3}\end{pmatrix}$$

  정리 7-1로부터 두 선형변환의 합성의 행렬표현 $[UT]_\beta$ 는 다음과 같음을 알 수 있다.

$$\begin{align}[UT]_\beta=&[U]_\alpha^\beta[T]_\beta^\alpha\\=&\begin{pmatrix}0&1&0&0\\0&0&2&0\\0&0&0&3\end{pmatrix}\begin{pmatrix}0&0&0\\1&0&0\\0&\frac{1}{2}&0\\0&0&\frac{1}{3}\end{pmatrix}\\=&\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}=I_3=[I_V]_\beta\end{align}$$

  정리 5.2-4로부터 $UT=I_V$ 임을 알 수 있다. 이 결과는 아래의 '미적분학의 기본정리'에 만족한다.

$$UT(f(x))=\frac{d}{dx}\int_0^xf(t)dt=f(x)$$

 

 

7.1. 행렬 곱의 성질

 

  행렬 곱이 잘 정의되었으므로 다음과 같은 행렬 곱의 성질을 이야기할 수 있다. 이는 정리 6-2와 상당히 유사하다.

 

정리 7.1-1)  $p\times m$ 행렬 $A,\;A_1,\;A_2$ 와 $m\times n$ 행렬 $B,\;B_1,\;B_2$ 에 대하여 다음이 성립한다.
  (ⅰ) $A(B_1+B_2)=AB_1+AB_2$
  (ⅱ) $(A_1+A_2)B=A_1B+A_2B$
  (ⅲ) $BI_n=I_mB=B$
  (ⅳ) 임의의 스칼라 $a\in F$ 에 대하여, $a(AB)=(aA)B=A(aB)$

 

※ 행렬 곱의 정의를 통한 증명은 매우 쉽게 할 수 있다. 그대신 새로운 증명을 소개한다.

 

proof)

  각각 차원이 $n\;m,\;p$ 인 임의의 $F$-벡터공간 $V,\;W,\;Z$ 와 각각의 순서기저 $\alpha,\;\beta,\;\gamma$ 를 생각하자. 선형변환의 존재성 및 유일성 정리 2에 따라 다음을 만족하는 선형변환 $U,\;U_1,\;U_2:W\to Z$ 와 $T,\;T_1,\;T_2:V\to W$ 가 각각 유일하게 존재한다.

$$[U]_\beta^\gamma=A,\;[U_1]_\beta^\gamma=A_1,\;[U_2]_\beta^\gamma=A_2$$

$$[T]_\alpha^\beta=B,\;[T_1]_\alpha^\beta=B_1,\;[T_2]_\alpha^\beta=B_2$$

  정리 5.2-1과 정리 6-2를 바탕으로 다음이 성립한다.

  (ⅰ) :

$$\begin{align}A(B_1+B_2)=&[U]_\beta^\gamma([T_1]_\alpha^\beta+[T_2]_\alpha^\beta)\\=&[U]_\beta^\gamma[T_1+T_2]_\alpha^\beta\\=&[U(T_1+T_2)]_\alpha^\gamma\\=&[UT_1+UT_2]_\alpha^\gamma\\=&[UT_1]_\alpha^\gamma+[UT_2]_\alpha^\gamma\\=&[U]_\beta^\gamma[T_1]_\alpha^\beta+[U]_\beta^\gamma[T_2]_\alpha^\beta\\=&AB_1+AB_2\end{align}$$

  (ⅱ) :

$$\begin{align}(A_1+A_2)B=&([U_1]_\beta^\gamma+[U_2]_\beta^\gamma)[T]_\alpha^\beta\\=&[U_1+U_2]_\beta^\gamma[B]_\alpha^\beta\\=&[(U_1+U_2)T]_\alpha^\gamma\\=&[U_1T+U_2T]_\alpha^\gamma\\=&[U_1T]_\alpha^\gamma+[U_2T]_\alpha^\gamma\\=&[U_1]_\beta^\gamma[T]_\alpha^\beta+[U_2]_\beta^\gamma[T]_\alpha^\beta\\=&A_1B+A_2B\end{align}$$

  (ⅲ) : $I_n=[I_V]_\alpha$ , $I_m=[I_W]_\beta$ 이므로 다음이 성립한다.

$$BI_n=[T]_\alpha^\beta[I_V]_\alpha=[TI_V]_\alpha^\beta=[T]_\alpha^\beta=B$$

$$I_mB=[I_W]_\beta[T]_\alpha^\beta=[I_WT]_\alpha^\beta=[T]_\alpha^\beta=B$$

$$\therefore BI_n=I_mB=B$$

  (ⅳ) :

$$\begin{align}(aA)B=&(a[U]_\beta^\gamma)[T]_\alpha^\beta=[aU]_\beta^\gamma[T]_\alpha^\beta\\=&[(aU)T]_\alpha^\gamma=[a(UT)]_\alpha^\gamma\\=&a[UT]_\alpha^\gamma=a([U]_\beta^\gamma[T]_\alpha^\beta)\\=&a(AB)\end{align}$$

$$\begin{align}A(aB)=&[U]_\beta^\gamma(a[T]_\alpha^\beta)=[U]_\beta^\gamma[aT]_\alpha^\beta\\=&[U(aT)]_\alpha^\gamma=[a(UT)]_\alpha^\gamma\\=&a[UT]_\alpha^\gamma=a([U]_\beta^\gamma[T]_\alpha^\beta)\\=&a(AB)\end{align}$$

$$\therefore (aA)B=A(aB)=a(AB)\tag*{$\square$}$$

 

 

따름정리 7.1-2)  $p\times m$ 행렬 $A,\;A_1,\;A_2,\ldots,\;A_k$ 와 $m\times n$ 행렬 $B,\;B_1,\;B_2,\;\ldots,\;B_k$ , 그리고 임의의 스칼라 $a_1,\ldots,a_k$ 에 대하여 다음이 성립한다.$$A\left(\sum_{i=1}^ka_iB_i\right)=\sum_{i=1}^ka_iAB_i$$$$\left(\sum_{i=1}^ka_iA_i\right)B=\sum_{i=1}^ka_iA_iB$$

 

proof)

  $k$ 에 대한 수학적 귀납법으로 증명한다. $k=1$ 일때는 정리 7.1-1(ⅳ)와 동일하므로 주어진 정리가 자명하게 성립한다.

  2 이상의 자연수 $j$ 에 대해 $k=j-1$ 일때 주어진 정리가 참이라고 가정하자. 다음이 성립한다.

$$\mbox{let, }\sum_{i=1}^{j-1}a_iB_i=C,\;\sum_{i=1}^{j-1}a_iA_i=D$$

$$\begin{align}A\left(\sum_{i=1}^ja_iB_i\right)=&A\left(\sum_{i=1}^{j-1}a_iB_i+a_jB_j\right)\\=&A(C+a_jB_j)\\=&AC+a_jAB_j\\=&A\left(\sum_{i=1}^{j-1}a_iB_i\right)+a_jAB_j\\=&\sum_{i=1}^{j-1}a_iAB_i+a_jAB_j\\=&\sum_{i=1}^ja_iAB_i\end{align}$$

$$\begin{align}\left(\sum_{i=1}^ja_iA_i\right)B=&\left(\sum_{i=1}^{j-1}a_iA_i+a_jA_j\right)B\\=&(D+a_jA_j)B\\=&DB+a_jA_jB\\=&\left(\sum_{i=1}^{j-1}a_iA_i\right)B+a_jA_jB\\=&\sum_{i=1}^{j-1}a_iA_iB+a_jA_jB\\=&\sum_{i=1}^ja_iA_iB\end{align}$$

  따라서 $k=j$ 일때 주어진 정리가 성립한다. 수학적 귀납법에 따라 임의의 자연수 $k$ 에 대하여 주어진 정리가 성립한다.   $\square$

 

 

  정의역과 공역이 같은 선형변환을 여러 번 합성하듯이, 행과 열의 수가 같은 행렬도 스스로 여러 번 곱할 수 있다.

 

정의)  $n\times n$ 행렬 $A$ 를 생각하자. $A^1:=A$ 라 정의하며, 2 이상의 자연수 k에 대하여 $A^k:=A^{k-1}A$ 로 정의한다. 편의상 $A^0=I_n$ 으로 정의한다.

 

  마지막에 $A^0=I_n$ 으로 정의한 것도 마찬가지로, 식 $A^k=A^{k-1}A$ 의 k에 1을 대입하면 $A^1=A^0A$ 를 얻으므로 합리적인 정의라고 할 수 있다.

 

  참고로 행렬은 행렬 곱에 대한 소거법칙이 성립하지 않는다. 다시말해 $AB=AC$ 이어도 $B=C$ 임이 보장되지 않는다는 것이다.[각주:1] 예로 $A=\begin{pmatrix}0&0\\1&0\end{pmatrix}$ 를 생각하자. $AA$ 를 계산하면 $2\times2$ 영행렬 $O$ 임을 알 수 있다. $AA=O$ , $AO=O$ 이므로 $AA=AO$ 이지만 $A\ne O$ 이다.

 

  아래는 행렬 곱에 대한 전치행렬[각주:2]에 대해 소개한다. 이 정리는 '행렬의 열벡터에 대한 성질'을 증명 한 뒤 '행렬의 행벡터에 대한 성질'을 바로 알아내기 위해 사용되곤 한다.

 

정리 7.1-3)  $p\times m$ 행렬 $A$ , $m\times n$ 행렬 $B$ 에 대하여 $(AB)^t=B^tA^t$ 가 성립한다.

 

proof)

  전치행렬에 대하여, 다음과 같은 성질이 성립함을 떠올리자.

$$(A^t)_{ij}=A_{ji}$$

  모든 $i=1,\ldots,p$ , $j=1,\ldots,n$ 에 대하여 다음이 성립한다.

$$\begin{align}\{(AB)^t\}_{ij}=&(AB)_{ji}\\=&\sum_{k=1}^mA_{jk}B_{ki}\\=&\sum_{k=1}^m(A^t)_{kj}(B^t)_{ik}\\=&\sum_{k=1}^m(B^t)_{ik}(A^t)_{kj}\\=&(B^tA^t)_{ij}\end{align}$$

  따라서 $(AB)^t=B^tA^t$ 가 성립한다.   $\square$

 

 

읽어주셔서 감사합니다.

 

  이전 읽을거리 : [선형변환부터 동형사상까지] ch3. 선형변환의 행렬표현

  다음 읽을거리 : [선형변환부터 동형사상까지] ch5. 행렬 연산

  1. 가역행렬과 행렬식에 대해 알고있는 사람은, B=C가 보장되기 위한 조건이 det(A)=0 임을 알 것이다. [본문으로]
  2. 행렬의 각 성분의 행과 열을 뒤집은 행렬. 상첨자에 T 또는 t를 표기하여 나타낸다. [본문으로]

댓글