Aerospace Kim

[다변수 미분] ch5. 역함수 정리

이전 읽을거리: ch4. 연쇄법칙


역함수 정리

 

  역함수 정리란 대략 "꼬여있지 않은 공간에는 국소적으로 역함수가 존재한다" 를 의미한다. (정확한 설명이 아님에 주의) 차근차근 증명해보자.

 

페르마의 임계점 정리 (interior extremum theorem)
  미분가능함수 ϕ:ATRmRaA 에서 local minimum 을 가지면 Dϕ(a)=0 이다.

 

※ Local minimum 이란 어떤 근방 속에서 최소값을 갖는 점을 의미한다.

 

  Proof.  각 j{1,,m} 에 대해 정의에 따라 다음과 같다.

(1)limt0ϕ(a+tej)ϕ(a)t=Djϕ(a)

  ϕa 에서 local minimum 을 가지므로 어떤 δ>0 이 존재하여 모든 xCδRm(a) 에 대해 다음이 성립한다.

ϕ(a)ϕ(x)

  한편 모든 tCδR(0) 에 대해 |(a+tej)a|<δ 이므로 a+tejCδRm(a) 이다. 정리하면 모든 tCδR(0) 에 대해 다음이 성립한다.

(2)ϕ(a)ϕ(a+tej)

  CδR(0)=(δ,δ) 임을 상기하자. 극한의 성질(링크의 정리 5.2.)에 따라 t(0,δ) 에서만 취해도 식 (1)이 성립하며, 이 경우 극한식 내부의 함수는 식 (2)에 따라 양수이므로 극한의 성질(링크의 정리 5.6.)에 따라 Djϕ(a)0 을 얻는다. 다시 t(δ,0) 에서만 취해도 식 (1)이 성립하며, 이 경우 극한식 내부의 함수는 식 (2)에 따라 음수이므로 Djϕ(a)0 을 얻는다. 정리하면 Djϕ(a)=0 을 얻으며, 이는 Dϕ(a) 의 모든 성분이 0임을 의미하므로 Dϕ(a)=0 가 성립한다.   

 

 

Definition.  어떤 집합이 그 집합의 임의의 두 점을 잇는 line segment 를 포함하면 convex 하다고 한다.

 

Lemma 5.1.  임의의 cRn , ϵ>0 에 대해 CϵRn(c) 는 convex 하다.

 

  Proof.  임의의 a,bCϵRn)(c) 와 임의의 t[0,1] 에 대해 다음이 성립함을 보이자.

a+t(ba)CϵRn)(c)

  |ac|<ϵ|bc|<ϵ 가 성립하므로 다음을 얻는다.

|a+t(ba)c|=|(1t)a+tb(1t)tc|=|(1t)(ac)+t(bc)||(1t)(ac)|+|t(bc)|=(1t)|ac|+t|bc|<(1t)δ+tδ=δ 

  따라서 원하는 결과를 얻는다.   

 

 

Lemma 5.2.  C1 급함수 f:ATRnRn 와 어떤 aA 에 대해 Df(a) 가 non-singular 이면 어떤 α>0 이 존재하여 A 에 포함되는 어떤 CϵRn(a) 안의 모든 x0,x1 에 대해 다음이 성립한다.α|x0x1||f(x0)f(x1)|  이는 fCϵRn(a) 에서 단사임을 함의한다.

 

※ Non-singular 란 행렬의 행렬식이 0이 아님을 의미하며, 이는 행렬이 가역임과 동치이다. 자세한 정보는 [행렬식의 엄밀한 정의] ch6. 행렬식의 엄밀한 정의 참고

 

  Proof.  E=Df(a) 라고 하자. α=12n|E1| 이라고 하면 sup norm 의 성질(링크의 정리 1.5.)에 따라 다음이 성립한다.

|x0x1|=|E1(Ex0Ex1)|n|E1||Ex0Ex1|=12α|Ex0Ex1|

2α|x0x1||Ex0Ex1|

  함수 h(x)=f(x)Ex 를 생각하자. hA 에서 정의된 C1 급함수이며 Dh(x)=Df(x)E 이고, 특히 Dh(a)=0 임을 알 수 있다. hC1 급이므로 각 Djhia 에서 연속이다. 따라서 어떤 δij>0 이존재하여 임의의 xA 에 대해 다음이 성립한다.

xCδijRn(a)|Djhi(x)|<αn

  A 는 열린집합이므로 A 에 포함되는 어떤 CδRn(a) 가 존재한다. 다음과 같이 정의하자.

ϵ=min({δ}{δij:i,j{1,,n}})

  임의의 xA 에 대해 다음이 성립한다.

xCϵRn(a)i,j{1,,n},|Djhi(x)|<αn|Dh(x)|<αn

  x0,x1CϵRn(a) 라고 하자. 도움정리 5.1.에 따라 x0x1 을 잇는 line segment 는 CϵRn(a) 안에 포함되며, 평균값 정리에 따라 어떤 cCϵRn(a) 에 대해 다음이 성립한다.

|h(x0)h(x1)|=|Dh(c)(x0x1)|n|Dh(c)||x0x1|<α|x0x1|

  따라서 다음을 얻는다.

α|x0x1||h(x0)h(x1)|=|f(x0)Ex0f(x1)+Ex1|=|(Ex1Ex0)(f(x0)f(x1))||Ex1Ex0||f(x0)f(x1)|2α|x0x1||f(x0)f(x1)|

α|x0x1||f(x0)f(x1)|

  이때 fCϵRn(a) 에서 단사임을 보이자. 임의의 x0,x1CϵRn(a) 에 대해 x0x1 이면 |x0x1|0 이므로 위 부등식에 따라 |f(x0)f(x1)|0 이다. 즉 f(x0)f(x1) 이므로 fCϵRn(a) 에서 단사임을 얻는다.   

 

 

  아래의 도움정리는 사실상 역함수 정리의 본질이며, 완성된 역함수 정리보다 더 자주 인용되곤 한다. 단사함수는 공역에서 치역에 포함되지 않는 부분을 제거하여 전단사함수를 만들 수 있음을 기억하자.

 

Lemma 5.3.  Cr 급 단사함수 f:ATRnRn 와 각 aA 에 대해 Df(a) 가 non-singular 이면 f(A)=B 라고 할때 BTRn 이며 역함수 g:BACr 급이다.

 

  Proof.

  Step 1. BTRn 임을 보이자. 임의의 bB 를 고정하자. f 는 단사이므로 f(a)=b 를 만족하는 aA 가 유일하게 존재한다. ATRn 이므로 어떤 γ>0 이 존재하여 CγRn(a)A 이다. 다음의 집합을 생각하자.

Q={xRn:|xa|γ2}

  QCγRn(a) 이므로 Q 는 유계이고 QA 이다. 한편 QRn 의 rectangle 이므로 콤팩트하다. (링크의 정리 7.5. 참고) 하이네-보렐 정리에 따라 QRn 에서 닫혀있으므로 Bd QQ 이다. (링크의 정리 3.7.과 링크의 정리 6.1. 참고) Q 가 유계이므로 Bd Q 도 유계이며, Bd Q 의 여집합은 Int QExt Q 이므로 Bd QRn 에서 닫혀있다. 다시 하이네-보렐 정리에 따라 Bd Q 는 콤팩트하다. 한편 f 는 연속이기에 f(Bd Q) 는 콤팩트하므로 (링크의 최대-최소 정리 참고) Rn 에서 닫혀있고 유계이다. 한편 다음이 성립함을 안다. (링크의 정리 6.2. 참고)

Int Q={xRn:|xa|<γ2}=Cγ2Rn(a)

  따라서 aInt Q 이므로 aBd Q 이다. f 는 단사이므로 f(a)=b 에 대해 bf(Bd Q) 임을 알 수 있다. 따라서 bRnf(Bd Q) 이며 이는 Rn 에서 열려있으므로 어떤 δ>0 이 존재하여 다음이 성립한다. (Euclidean metric 을 이용함에 주의. 링크의 정리 2.1. 참고)

B2δRn(b)Rnf(Bd Q)

  이때 BδRn(b)B 임을 보이자. 임의의 cBδRn(b) 에 대해 다음의 함수 ϕ:AR 를 생각하자.

ϕ(x)=||f(x)c||2=(f1(x)c1)2++(fn(x)cn)2

  이 함수가 Cr 급임은 자명하다. Q 는 콤팩트하므로 최대-최소 정리에 따라 ϕQ 에서 최솟값을 갖는다. 이 최소점 qQ 에 대해 f(q)=c 임을 보이자. 우선 다음이 성립한다.

ϕ(a)=||f(a)c||2=||bc||2

  이때 cBδRn(b) 이므로 ϕ(a)<δ2 이다. 한편 qϕ 의 최소점이므로 ϕ(q)<δ2 가 성립해야 한다. qQ 이고 Q=Int QBd Q 이므로 qInt Q 또는 qBd Q 이다. 만약  qBd Q 라면 f(q)f(Bd Q) 이므로 f(q)B2δRn(b) 가 성립하며 다음을 얻는다.

2δ||f(q)b||||f(q)c||+||cb||<||f(q)c||+δ

||f(q)c||>δ

  따라서 ϕ(q)>δ2 를 얻으며, 이는 ϕ(q)<δ2 임에 어긋나므로 qBd Q 가 성립하지 않는다. 따라서 qInt Q 를 얻는다. 그러므로 qϕ 의 local minimum 이기도 하며, 페르마의 임계점 정리에 따라 q 에서 ϕ 의 미분은 0(영행렬)이다. 한편 각 j{1,,n} 에 대해 다음이 성립한다.

ϕ(q)=k=1n(fk(q)c)2

Djϕ(q)=k=1n2(fk(q)c)Djfk(q)

  식 Dϕ(q)=0 은 다음과 같이 쓸 수 있다.

Dϕ(q)=(D1ϕ(q)Dnϕ(q))=2(k=1n(fk(q)c)D1fk(q)k=1n(fk(q)c)Dnfk(q))=2((f1(q)c)(fn(q)c))Df(q)

((f1(q)c)(fn(q)c))Df(q)=0

  이때 Df(q) 는 non-singualr 이므로 역행렬을 위 식의 양변에 곱하면 다음을 얻는다.

((f1(q)c)(fn(q)c))=0

f(q)=c

  이때 cBδRn(b) 에서 임의로 선택하였으므로 BδRn(b)f(A) 를 얻으며, f(A)=B 이므로 BRn 에서 열려있다.

 

  Step 2. f 의 역함수 g:BA 가 연속임을 보이자. 임의의 UTA 를 생각하자. 이때 ATRn 이므로 UTRn 이다. (링크의 따름정리 3.4. 참고) V=g1(U) 라고 하면 V=f(U) 이다. f 는 단사이므로 f|U 도 단사이며, 각 aU 에 대해 Df|U(a)=Df(a) 는 non-singular 이므로 step 1에 따라 f|U(U)=f(U)Rn 에서 열려있다. 다시말해 g1(U)Rn 에서 열려있으므로 연속의 정의에 따라 g 는 연속이다.

 

  Step 3. g 가 미분가능함을 보이자. 임의의 bB 를 고정하면 b=f(a) 를 만족하는 aA 가 유일하게 존재한다. 도움정리 5.2.에 따라 어떤 CNRn(a)α>0 이 존재하여 모든 x0,x1C 에 대해 다음이 성립한다.

α|x0x1||f(x0)f(x1)|

  Step 1에 따라 f(C)TRn 이며 b=f(a)f(C) 이므로 f(C)NRn(b) 이다. 따라서 어떤 δ1>0 이 존재하여 다음이 성립한다.

Cδ1Rn(b)f(C)

g(Cδ1Rn(b))g(f(C))=C

  임의의 bCδ1Rn(b){b} 를 고정하고 x0=g(b) , x1=g(b) 라고 하자. 다음이 성립한다.

α|g(b)g(b)||bb|

|g(b)g(b)||bb|1α

  이때 g 는 단사이므로 g(b)g(b) 이며 따라서 다음이 성립한다.

g(b)g(b)Df(a)1(bb)|bb|=Df(a)1bbDf(a)(g(b)g(b))|g(b)g(b)||g(b)g(b)||bb|

  따라서 sup norm 의 성질(링크의 정리 1.5.)에 따라 다음을 얻는다.

|g(b)g(b)Df(a)1(bb)||bb|n|Df(a)1||bbDf(a)(g(b)g(b))||g(b)g(b)||g(b)g(b)||bb|n|Df(a)1|α|bbDf(a)(g(b)g(b))||g(b)g(b)|

  fa 에서 미분가능하므로 임의의 ϵ>0 에 대해 어떤 γ>0 이 존재하여 모든 aA 에 대해 다음이 성립한다.

aCγRn(a)|f(a)f(a)Df(a)(aa)||aa|<αn|Df(a)1(a)|ϵ

  Step 2에 따라 gb 에서 연속이므로 어떤 δ2>0 이 존재하여 임의의 bB 에 대해 다음이 성립한다.

|bb|<δ2g(b)CγRn(g(b))=CγRn(a)

  δ=min{δ1,δ2} 라고 하면 임의의 bCδRn(b){b} 에 대해 g(b)CγRn(a) 이므로 다음이 성립한다.

ϵ>n|Df(a)1(a)|α|f(g(b))f(a)Df(a)(g(b)a)||g(b)a|=n|Df(a)1(a)|α|bbDf(a)(g(b)g(b))||g(b)g(b)|1α|g(b)g(b)Df(a)1(a)(bb)||g(b)g(b)||g(b)g(b)||bb||g(b)g(b)Df(a)1(a)(bb)||g(b)g(b)|=|g(b)g(b)Df(a)1(a)(bb)||bb|

  따라서 gb 에서 미분가능하며, gB 에서 임의로 선택하였으므로 g 는 미분가능하다.

 

  Step 4. gCr 급임을 보이자. Step 3에 따라 g 는 미분가능하므로 연쇄법칙에 따라(링크의 따름정리 4.2.) 각 yB 에 대해 다음이 성립한다.

Dg(y)=Df(f(y))1

  Non-singular 인 n×n 행렬의 집합을 GL(n) 이라고 하자. 가역행렬을 그 역행렬에 대응하는 사상을 I:GL(n)GL(n) 라고 하자. 함수 Dg:BGL(n) 는 다음의 세 함수의 합성이다.

BgADfGL(n)IGL(n)

  함수 I 에 대해 생각해보자. 임의의 CGL(n) 에 대해 I(C) 는 각 성분이 C 의 성분으로 이루어진 분수다항식으로 구성된 n×n 행렬이다. 한편 함수 1x 는 자명히 C 이므로 I(C) 의 각 성분은 C 의 성분에 대한 C 급함수이다. gCr 급임을 r 에 대한 귀납법으로 증명하자. fC1 급이면 Df 의 각 성분함수는 연속이다. g 는 미분가능하므로 연속이며, 따라서 Dfg 의 각 성분함수는 연속이다. 위 논의에 따라 IDfg 의 각 성분함수도 연속이다. 정리하면 Dg 의 각 성분함수는 연속이므로 gC1 급임을 알 수 있다. r1 에 대해 Step 4의 결론이 성립한다고 가정하고 r 에 대해서도 성립함을 보이자. fCr 급이면 Cr1 급이기도 하며, 귀납법 가정에 따라 gCr1 급이다. 따라서 Dfg 의 각 성분함수는 Cr1 이며 따라서 IDfg 의 각 성분함수는 Cr1 급이다. 정리하면 Dg 의 각 성분함수는 Cr1 급이므로 gC1 급임을 알 수 있다. (링크의 정리 3.3. 참고) 따라서 임의의 rN 에 대해 주어진 정리가 성립한다.   

 

 

역함수 정리 (inverse function theorem)
  Cr 급함수 f:ATRnRn 와 어떤 aA 에 대해 Df(a) 가 non-singular 이면 어떤 UNA(a) 가 존재하여 어떤 VTRn 에 대해 f|U:UV 는 전단사이며 그 역함수는 Cr 급이다.

 

  Proof.  도움정리 5.2.에 따르면 어떤 U0NA(a) 가 존재하여 f|U0 이 단사이다. 한편 det Df(x)x 에 대한 연속함수이며 det Df(a)0 이므로 어떤 δ>0 이 존재하여 다음이 성립한다.

xCδRn(a)|det Df(x)det Df(a)|<|det Df(a)|

  이때 역삼각 부등식에 따라 다음이 성립한다.

|det Df(a)||det Df(x)||det Df(a)det Df(x)|

  따라서 다음이 성립한다.

xCδRn(a)0<|det Df(x)|

  다시말해 임의의 xCδRn(a) 에 대해 det Df(x)0 이다. U=U0CδRn(a) 라고 하면 f|U 는 단사이고 임의의 aU 에 대해 Df|U(a)=Df(a) 는 non-singular 이므로 도움정리 5.3.에 따라 전단사함수 f|U:UV 는 치역이 Rn 에서 열려있으며 역함수가 Cr 급이므로 본 정리가 성립한다.   

 

 

읽어주셔서 감사합니다.

 

 

References)

[1] James R. Munkres. (1991). Analysis on manifolds. CRC press.


이전 읽을거리: ch4. 연쇄법칙