Aerospace Kim

[선형변환부터 동형사상까지] ch7. 가역인 선형변환

  이전 읽을거리 : [선형변환부터 동형사상까지] ch6. 좌측 곱 변환

  다음 읽을거리 : [선형변환부터 동형사상까지] ch8. 동형사상

 

  본 포스팅은 '프리드버그 선형대수학(5판)'을 공부하며 작성하였습니다.

 

 

10. 가역인 선형변환

 

  함수의 역함수에 대해서는 ch0. 함수에서 살펴보았다. 선형변환의 역함수에 대해 공부하기 전에 먼저 보고 오길 추천한다.

 

  선형변환에 대하여 역함수의 정의를 또 적어보자.

 

정의)  벡터공간 $V,\;W$ 와 선형변환 $T:V\to W$ 를 생각하자. $TU=I_W$ , $UT=I_V$ 를 만족하는 함수 $U:W\to V$ 가 존재하면 선형변환 $T$ 는 가역(invertible)이라고 한다. 유일한 함수 $U$ 는 $T$ 의 역함수(inverse)라고 하며 $T^{-1}$ 라고 표기한다.

 

  ch0. 함수에서 살펴본, 역함수에 대한 사실을 나열하면 다음과 같다.

  ▶ 함수가 가역이기 위한 필요충분조건은 함수가 전단사인 것이다.

  ▶ 가역인 함수의 역함수는 유일하게 존재한다.

  ▶ 가역인 함수의 역함수는 가역이며, 함수의 역함수의 역함수는 원래 함수와 같다.

  ▶ 두 가역인 함수 $U:W\to Z$ , $T:V\to W$ 에 대하여 $UT$ 는 가역이며 $(UT)^{-1}=T^{-1}U^{-1}$ 이다.

  추가적으로, 선형변환의 성질로부터 다음의 정리가 성립한다.

 

정리 10-1)  차원이 같은 유한차원 벡터공간 $V,\;W$ 와 선형변환 $T:V\to W$ 를 생각하자. $T$ 가 가역이기 위한 필요충분조건은 $\mbox{rank}(T)=\mbox{dim}(V)$ 인 것이다.

 

proof)

  $T$ 가 가역일 때를 생각하자. $T$ 가 가역이면 전단사이며, $T$ 의 정의역과 공역의 차원이 같으므로 정리 2.2-2로부터 $\mbox{rank}(T)=\mbox{dim}(V)$ 임이 보장된다.

 

  $\mbox{rank}(T)=\mbox{dim}(V)$ 일 때를 생각하자. $T$ 의 정의역과 공역의 차원이 같으므로 정리 2.2-2로부터 $T$ 는 단사이며 전사이다. 즉, 전단사이다.   $\square$

 

 

  선형변환의 역함수가 선형임은 아주 유용한 성질이다. 역함수가 선형임을 알아 낸 뒤에는, 역함수에 대해서도 선형변환에 대해 알아낸 모든 성질과 정의를 적용할 수 있다.

 

정리 10-2)  벡터공간 $V,\;W$ 와 가역인 선형변환 $T:V\to W$ 를 생각하자. $T^{-1}:W\to V$ 는 선형이다.

 

proof)

  정리 0.4.1-3에 따라, 임의의 두 벡터 $y_1,\;y_2\in W$ 에 대하여 $T$ 는 전단사이므로 $T(x_1)=y_1$ , $T(x_2)=y_2$ 인 벡터 $x_1,\;x_2\in V$ 가 각각 유일하게 존재하며 $x_1=T^{-1}(y_1)$ , $x_2=T(y_2)$ 이다. 임의의 스칼라 $c\in F$ 에 대하여 다음이 성립한다.

$$\begin{align}T^{-1}(cy_1+y_2)=&T^{-1}(cT(x_1)+T(x_2))\\=&T^{-1}(T(cx_1+x_2))\\=&cx_1+x_2\\=&cT^{-1}(y_1)+T^{-1}(y_2)\end{align}$$

  정리 1.1-1(ⅱ)에 따라 $T^{-1}$ 는 선형이다.   $\square$

 

 

  다음의 정리에 따르면 가역인 선형변환의 정의역과 공역은 차원이 같다. 이 정리는 가역인 선형변환이 존재하려면 정의역과 공역이 어떤 조건을 갖추어야 하는지에 대한 심오한 암시를 준다. 이러한 생각은 다음 포스팅에서 동형을 공부할 때 꽃을 피운다.

 

정리 10-3)  벡터공간 $V,\;W$ 와 가역인 선형변환 $T:V\to W$ 를 생각하자. $V$ 가 유한차원이기 위한 필요충분조건은 $W$ 가 유한차원인 것이며, 이때 $\mbox{dim}(V)=\mbox{dim}(W)$ 이다.

 

proof)

  $V$ 가 유한차원일 때를 생각하자. $V$ 의 유한기저 $\beta$ 에 대하여, $T$ 는 가역이므로 전사이다. 따라서 $T(V)=W$ 이며 정리 2.1-1에 따라 다음이 성립한다.

$$W=R(T)=\mbox{span}(T(\beta))$$

  즉, 유한집합인 $T(\beta)$ 가 $W$ 를 생성하므로 $W$ 는 유한차원이다. 반대로 $W$ 가 유한차원일 때를 생각하자. $W$ 의 유한 $T^{-1}:W\to V$ 는 가역이므로 전사이다. 따라서 $T^{-1}(W)=V$ 이며 정리 2.1-1에 따라 다음이 성립한다.

$$V=R(T^{-1})=\mbox{span}(T^{-1}(\gamma))$$

  즉, 유한집합인 $T^{-1}(\gamma)$ 가 $V$ 를 생성하므로 $V$ 는 유한차원이다.

 

  $V,\;W$ 모두 유한차원일 때를 생각하자.[각주:1] $T$ 는 단사이므로 정리 2.2-1에 따라 $\mbox{nullity}(T)=0$ 이며, $T$ 는 전사이므로 $R(T)=W$ 이기에 $\mbox{rank}(T)=\mbox{dim}(W)$ 이다. 차원정리에 따라 다음이 성립한다.

$$\begin{align}\mbox{dim}(V)=&\mbox{nullity}(T)+\mbox{rank}(T)\\=&0+\mbox{rank}(T)\\=&\mbox{dim}(W)\end{align}$$

  따라서 정의역과 공역의 차원이 같다.   $\square$

 

 

10.1. 가역인 행렬

 

  행렬에서도 가역을 정의할 수 있지만, 행렬은 근본적으로 함수와 달리 방향성이 없는 대상이다. 그렇기에 가역(可逆)을 정의하는 것이 부자연스럽게 느껴질 수도 있다. 이에 대하여, 필자는 선형변환의 가역과 행렬의 가역을 연관지어 생각하게 만드는 일종의 라이밍(rhyming)으로 생각한다. 우리는 선형변환과 행렬이 어떤 관계에 있는지 알고있다.[각주:2] 가역인 행렬을 잘 정의하면 가역인 선형변환과 보기 좋은 관계가 형성되며, 서로가 가역이기에 만족하는 성질을 유사하게 공유하게 된다. 그렇기에 어떤 행렬이 가역임을 '거꾸로 갈 수 있는 행렬' 따위가 아니라, 그 행렬에 대응하는 선형변환의 가역성과 연관지어 이해하는 것이 좋을 듯 하다.

 

  가역인 행렬은 처음부터 정사각행렬[각주:3]로 정의하는 것이 보편적이다. 하지만 선형대수학을 공부해본 사람이라면 "정사각행렬이 아닌데 가역일 수는 없는것인가?" 하는 의문을 가져본 적이 있을 것이다. 이러한 질문에 대답하기 위하여 가역인 함수를 정의할 때와 비슷하게 출발하자.

 

정의)  $m\times n$ 행렬 $A$ 에 대하여 $BA=I_n$ 을 만족하는 $n\times m$ 행렬 $B$ 를 $A$ 의 왼쪽 역행렬(left inverse)이라 하며, $AC=I_m$ 을 만족하는 $n\times m$ 행렬 $C$ 를 $A$ 의 오른쪽 역행렬(right inverse)이라 한다.

 

  다음의 강력한 정리를 이용할 것이다. 아래의 정리가 없어도 행렬의 성질만으로 가역인 행렬이 정사각행렬임을 밝힐 수 있지만, 정말 길고 어려운 길이다. 굳이 고통스러운 방법을 알고싶다면 'Munkres. Analysis on manifold' 의 1장을 참고하시라.

 

정리 10.1-1)  행렬 $A$ 가 왼쪽 역행렬을 가지기 위한 필요충분조건은 $L_A$ 가 왼쪽 역함수를 가지는 것이며, $A$ 가 오른쪽 역행렬을 가지기 위한 필요충분조건은 $L_A$ 가 오른쪽 역함수를 가지는 것이다.

 

proof)

  $m\times n$ 행렬 $A$ 가 어떤 $n\times m$ 왼쪽 역행렬 $B$ 를 가질 때를 생각하자. $BA=I_n$ 이며, 정리 9-2에 따라 다음이 성립한다.

$$L_{BA}=L_BL_A=L_{I_n}=I_{F^n}$$

  $L_BL_A=I_{F^n}$ 이므로 $L_A$ 는 왼쪽 역함수 $L_B:F^m\to F^n$ 을 가진다.

 

  $m\times n$ 행렬 $A$ 에 대하여 $L_A:F^n\to F^m$ 이 어떤 왼쪽 역함수 $T:F^m\to F^n$ 을 가질 때를 생각하자. $F^n,\;F^m$ 각각의 표준 순서기저를 $\beta,\;\gamma$ 라고 하면 정리 9-2(ⅴ)에 따라 $T=L_{[T]_\gamma^\beta}$ 이다. $TL_A=I_{F^n}$ 이므로 다음이 성립한다.

$$TL_A=L_{[T]_\gamma^\beta}L_A=L_{[T]_\gamma^\beta A}=I_{F^n}=L_{I_n}$$

  $L_{[T]_\gamma^\beta A}=L_{I_n}$ 이므로 정리 9-2(ⅱ)에 따라 $[T]_\gamma^\beta A=I_n$ 이 성립한다. 따라서 $A$ 는 $n\times m$ 왼쪽 역행렬 $[T]_\gamma^\beta$ 를 가진다.

  오른쪽 역행렬에 대한 명제도 비슷하게 증명할 수 있다.   $\square$

 

 

  위 정리의 증명과정으로부터 다음의 정리가 자명하다.

 

정리 10.1-2)  (역행렬의 유일성) 어떤 행렬 $A$ 의 왼쪽 역행렬이 $B$ 이기 위한 필요충분조건은 $L_A$ 의 왼쪽 역함수가 $L_B$ 인 것이며, $A$ 의 오른쪽 역행렬이 $C$ 이기 위한 필요충분조건은 $L_A$ 의 오른쪽 역함수가 $L_C$ 인 것이다.

 

  이제 역행렬에 대한 증명을 해결해버릴 준비가 다 되었다.

 

정리 10.1-3)  어떤 행렬 $A$ 에 대한 왼쪽 역행렬과 오른쪽 역행렬이 모두 존재한다면, 그 둘은 동일하며 유일하다. 이때 $A$ 및 $A$ 의 왼쪽 역행렬과 오른쪽 역행렬은 모두 정사각행렬이다.

 

proof)

  행렬 $A$ 의 어떤 왼쪽 역행렬 $B$ 와 어떤 오른쪽 역행렬 $C$ 가 존재한다고 가정하자. 위 정리들에 따라 $L_A$ 는 왼쪽 역함수로 $L_B$ , 오른쪽 역함수로 $L_C$ 를 가진다. 정리 0.4-1에 따라 $L_B=L_C$ 이며 $L_A$ 의 다른 왼쪽 역함수나 오른쪽 역함수는 존재하지 않는다. 만약 행렬 $A$ 가 $B$ 가 아닌 왼쪽 역행렬 또는 $C$ 가 아닌 오른쪽 역행렬을 가진다면 $L_A$ 도 마찬가지로 $L_B$ 가 아닌 왼쪽 역함수, $L_C$ 가 아닌 오른쪽 역함수를 가지게 되므로 모순. 따라서 $A$ 는 각각 유일한 왼쪽 역행렬 $B$ 와 오른쪽 역행렬 $C$ 를 가지며 $L_B=L_C$ 이므로 정리 9-2(ⅱ)에 따라 $B=C$ 이다.

 

  $m\times n$ 행렬 $A$ 가 왼쪽 역행렬과 오른쪽 역행렬을 모두 가지면 $L_A:F^n\to F^m$ 은 왼쪽 역함수와 오른쪽 역함수를 모두 가진다. 이러한 경우 $L_A$ 는 가역이므로 정리 10-3에 따라 $\mbox{dim}(F^n)=\mbox{dim}(F^m)$ 이므로 $n=m$ 이다. 따라서 $A$ 는 $n\times n$ 행렬이므로 정사각행렬이다. $B$ 와 $C$ 는 $n\times m$ 행렬이었으므로 마찬가지로 $n\times n$ 행렬인 정사각행렬이다.   $\square$

 

 

  위 정리에 따르면, 어떤 행렬에 왼쪽 역행렬과 오른쪽 역행렬이 모두 존재하는 상황 속에서 '역행렬'이라고 부를 수 있는 대상은 단 하나이다. 먼 길을 돌아왔지만 다음의 정의를 떳떳하게 할 수 있게 되었다.

 

정의)  $n\times n$ 행렬 $A$ 에 대하여 $AB=BA=I_n$ 인 $n\times n$ 행렬 $B$ 가 존재할 때, $A$ 는 가역(invertible)이라고 한다. 이때 $A$ 의 왼쪽 역행렬이며 오른쪽 역행렬인 유일한 행렬 $B$ 는 $A$ 의 역행렬(inverse)이라 하며 $A^{-1}$ 라고 표기한다.

 

  가역인 행렬을 가역행렬이라고 줄여 부를 수 있다.

 

  가역행렬을 소개하는 널리 알려진 방법은, 별도의 설명 없이 위 정의를 냅다 던져주는 것이다. 그러므로 가역행렬을 처음 공부하는 사람은 왜 가역행렬이 반드시 정사각행렬이어야 하는지 알수가 없다. 하지만 우리는 잘 알고있다.

 

  역행렬 존재 의의는 이제부터 역행렬을 사용하면서 직접 느끼면 된다.

 

 

10.2. 가역인 선형변환의 성질

 

  다음의 정리에 따라 가역인 선형변환은 가역인 행렬과 매우 밀접한 관계가 있다.

 

정리 10.2-1)  유한차원 벡터공간 $V,\;W$ 의 각각의 순서기저 $\beta,\gamma$ , 선형변환 $T:V\to W$ 를 생각하자. $T$ 가 가역이기 위한 필요충분조건은 $[T]_\beta^\gamma$ 가 가역인 것이며, 이때 $[T^{-1}]_\gamma^\beta=([T]_\beta^\gamma)^{-1}$ 이다.[각주:4]

 

  위 정리는 벡터공간에서 순서기저를 어떻게 잡느냐에 무관하게 성립함을 기억하자.

 

proof)

  $T$ 가 가역일 때를 생각하자. 정리 10-3에 따라 $\mbox{dim}(V)=\mbox{dim}(W)$ 이며, $\mbox{dim}(V)=n$ 이라고 한다면 $[T]_\beta^\gamma$ 는 $n\times n$ 행렬이다. $T$ 의 역함수 $T^{-1}$ 에 대하여 $T^{-1}T=I_{V}$ , $TT^{-1}=I_W$ 이므로 다음이 성립한다. (정리 5.2-2 참고)

$$[T^{-1}T]_\beta=[T^{-1}]_\gamma^\beta[T]_\beta^\gamma=[I_V]_\beta=I_n$$

$$[TT^{-1}]_\gamma=[T]_\beta^\gamma[T^{-1}]_\gamma^\beta=[I_W]_\gamma=I_n$$

  $[T^{-1}]_\gamma^\beta[T]_\beta^\gamma=[T]_\beta^\gamma[T^{-1}]_\gamma^\beta=I_n$ 이므로 $[T]_\beta^\gamma$ 는 가역이며 $([T]_\beta^\gamma)^{-1}=[T^{-1}]_\gamma^\beta$ 이다.[각주:5]

 

  $[T]_\beta^\gamma$ 가 가역일 때를 생각하자. $A[T]_\beta^\gamma=[T]_\beta^\gamma A=I_n$ 을 만족하는 $n\times n$ 행렬 $A$ 가 존재한다. 선형변환의 존재성 및 유일성 정리 2에 따라 $A=[U]_\beta^\gamma$ 를 만족하는 선형변환 $U$ 가 유일하게 존재하며, 다음이 성립한다.

$$[UT]_\beta=[U]_\gamma^\beta[T]_\beta^\gamma=I_n=[I_V]_\beta$$

$$[TU]_\gamma=[T]_\beta^\gamma[U]_\gamma^\beta=I_n=[I_W]_\gamma$$

  정리 5.2-4에 따라 $UT=I_V$ , $TU=I_W$ 이므로 $T$ 는 가역이다.   $\square$

 

 

  위 정리에서 정의역과 공역이 같은 벡터공간인 경우 마지막 결론이 $[T^{-1}]_\beta=([T]_\beta)^{-1}$ 로 써진다.

 

  다음의 따름정리는 유용하며 심지어 보기에도 좋다.

 

정리 10.2-2)  $n\times n$ 행렬 $A$ 를 생각하자. $A$ 가 가역이기 위한 필요충분조건은 $L_A$ 가 가역인 것이며, 이때 $(L_A)^{-1}=L_{A^{-1}}$ 이다.

 

proof)

  $\mathbb{F^n}$ 의 표준 순서기저 $\beta$ 를 생각하자. 정리 9-2와 정리 10.2-1에 따르면 $L_A$ 가 가역이기 위한 필요충분조건은 $[L_A]_\beta=A$ 가 가역인 것이다. 이때 다음이 성립한다.

$$[(L_A)^{-1}]_\beta=([L_A]_\beta)^{-1}=A^{-1}=[L_{A^{-1}}]_\beta$$

  정리 5.2-4에 따라 $(L_A)^{-1}=L_{A^{-1}}$ 가 성립한다.   $\square$

 

 

  가역행렬은 가역인 선형변환과는 약간 다르게 다음의 강력한 정리가 하나 더 성립한다. 이는 행렬이 가역이기 위해 왼쪽 역행렬과 오른쪽 역행렬 모두를 가질 필요는 없다는 말이다.

 

정리 10.1-4)  정사각행렬 $A$ 가 가역이기 위한 필요충분조건은 왼쪽 역행렬 또는 오른쪽 역행렬을 갖는 것이다.

 

proof)

  $n\times n$ 행렬 $A$ 가 가역일 때는 자명하게 왼쪽 역행렬과 오른쪽 역행렬을 갖는다.

 

  $A$ 가 왼쪽 역행렬을 가질 때를 생각하자. 즉, $BA=I_n$ 인 $n\times n$ 행렬 $B$ 가 존재한다. n차원인 임의의 두 벡터공간 $V,\;W$ 각각의 순서기저 $\beta,\;\gamma$ 를 생각하자. 선형변환의 존재성 및 유일성 정리 2에 따라 $A=[T]_\beta^\gamma$ , $B=[U]_\gamma^\beta$ 를 만족하는 선형변환 $T:V\to W$ , $U:W\to V$ 가 존재한다. 이때 정리 5.2-2에 따라 $I_n=[I_V]_\beta$ 이므로 $[UT]_\beta=[I_V]_\beta$ 가 성립한다. 정리 5.2-4에 따라 $UT=I_V$ 가 성립한다. 정리 0.3.1-2에 따라 $T$ 는 단사함수이고 $U$ 는 전사함수이다. 이때 $T$ 와 $U$ 모두 정의역과 공역의 차원이 동일하므로 정리 2.2-2에 따라 $T$ 는 전사함수이기도 하며 $U$ 는 단사함수이기도 하다. 즉 $T$ 와 $U$ 모두 전단사함수이다. 정리 10.2-1에 따라 $[T]_\beta^\gamma=A$ , $[U]_\gamma^\beta=B$ 는 가역이다. 정사각행렬 $B$ 도 가역이기 때문에 $A$ 가 오른쪽 역행렬을 가질 때에도 자명하게 $A$ 는 가역임을 알 수 있다.   $\square$

 

 

  다음 포스팅은 드디어 본 시리즈의 마지막인 동형사상에 대한 것이다.

 

 

읽어주셔서 감사합니다.

 

  이전 읽을거리 : [선형변환부터 동형사상까지] ch6. 좌측 곱 변환

  다음 읽을거리 : [선형변환부터 동형사상까지] ch8. 동형사상

  1. 이전의 논의에 따라 하나만 유한차원이어도 둘 다 유한차원이게 된다. [본문으로]
  2. 행렬표현! [본문으로]
  3. 행의 갯수와 열의 갯수가 같은 행렬 [본문으로]
  4. 역함수는 원래 함수의 정의역과 공역이 서로 바뀌므로, 역함수의 행렬표현에서 순서기저의 표기는 위아래가 바뀜에 유의하자. [본문으로]
  5. 함수의 행렬표현의 역행렬 = 함수의 역함수의 행렬표현 [본문으로]

댓글