Aerospace Kim

[미분의 정의부터 연쇄법칙까지] ch.5 미분 연산자의 성질

이전 읽을거리:

[미분의 정의부터 연쇄법칙까지] ch.0 미분이란?

[미분의 정의부터 연쇄법칙까지] ch.1 일변수 미분

[미분의 정의부터 연쇄법칙까지] ch.2 다변수 미분

[미분의 정의부터 연쇄법칙까지] ch.3 벡터장

[미분의 정의부터 연쇄법칙까지] ch.4 곡선


  본 포스팅은 PC chrome 환경에 최적화되어있습니다.

 

  본 포스팅에서는 미분의 의미부터 연쇄법칙의 유도까지 아주 상세하게 설명한다. 연쇄법칙의 원리를 아는 것의 가치는 태평양을 표류할 때의 나침반의 가치와 같다. 천천히, 꼼꼼하게 내용을 공부한다면, 연쇄법칙의 겉모양만 보고 기계적으로 연산하는 당신에게 커다란 통찰을 안겨줄 것이다. 이해가 안되거나 설명이 잘못되었다고 생각이 드는 부분이 있다면 얼마든지 댓글로 질문을 남겨주시기를 부탁드린다.

 

 

5. 미분 연산자의 성질

 

 

5.1. 일변수함수의 미분연산자

 

  일변수함수의 미분 연산자 D(미분계수)의 연산 특성은 다음과 같다.

 

정리 5.1-1)  정의역의 점 p에서 미분 가능한 함수 f,g:RR에 대하여 다음이 성립한다.
(ⅰ) cR,D(cf)(p)=cDf(p)
(ⅱ) D(f+g)(p)=Df(p)+Dg(p)
(ⅲ) D(fg)(p)=f(p)Dg(p)+Df(p)g(p)

 

proof ⅰ)

D(cf)(p)=limt0cf(p+t)cf(p)t=c(limt0f(p+t)f(p)t)=cDf(p)

 

proof ⅱ)

D(f+g)(p)=limt0{f(p+t)+g(p+t)}{f(p)+g(p)}t=limt0(f(p+t)f(p)t+g(p+t)g(p)t)=Df(p)+Dg(p)

 

proof ⅲ)

D(fg)(p)=limt0f(p+t)g(p+t)f(p)g(p)t=limt0f(p+t)g(p+t)f(p)g(p+t)+f(p)g(p+t)f(p)g(p)t=limt0(f(p+t)f(p)tg(p+t)+f(p)g(p+t)g(p)t)=Df(p)g(p)+f(p)Dg(p)

 

 

5.2. 다변수함수의 미분연산자

 

  다변수함수의 미분 연산자 Dv(방향 미분계수)의 연산 특성은 다음과 같다.

 

정리 5.2-1)  정의역의 점 P에서 미분 가능한 함수 f,g:RnR에 대하여 다음이 성립한다.
  (ⅰ) cR,Dcvf(P)=cDvf(P)=Dv(cf)(P)
  (ⅱ) Dv(f+g)(P)=Dvf(P)+Dvg(P)
  (ⅲ) Dv(fg)(P)=Dvf(P)g(P)+f(P)Dvg(P)

 

proof ⅰ)

Dcvf(P)=limt0f(P+tcv)f(P)t=c(limt0f(P+tcv)f(P)ct)=c(limτ0f(P+τv)f(P)τ)=cDvf(P)=limt0cf(P+tv)cf(P)t=Dv(cf)(P)

 

proof ⅱ)

Dv(f+g)(P)=limt0{f(P+tv)+g(P+tv)}{f(P)+g(P)}t=limt0(f(P+tv)f(P)t+g(P+tv)g(P)t)=Dvf(P)+Dvg(p)

 

proof ⅲ)
Dv(fg)(P)=limt0f(P+tv)g(P+tv)f(P)g(P)t=limt0f(P+tv)g(P+tv)f(P)g(P+tv)+f(P)g(P+tv)f(P)g(P)t=limt0(f(P+tv)f(P)tg(P+tv)+f(P)g(P+tv)g(P)t)=Df(P)g(P)+f(P)Dg(P)

 

  다변수함수의 미분 연산자 Dk(k번째 편미분계수)는 미분 연산자 Dv의 특별한 경우이므로, 정리 5.2-1의 연산 특성을 그대로 따른다.

 

  다변수함수의 미분 연산자 (기울기벡터)의 연산 특성은 다음과 같다.

 

정리 5.2-2)  정의역의 점 P에서 미분 가능한 함수 f,g:RnR에 대하여 다음이 성립한다.
  (ⅰ) cR,(cf)(P)=cf(P)
  (ⅱ) (f+g)(P)=f(P)+g(P)
  (ⅲ) (fg)(P)=f(P)g(P)+f(P)g(P)

 

proof ⅰ)

(cf)(P)=(cD1f(P),,cDnf(P))=c(D1f(P),,Dnf(P))=cf(P)

 

proof ⅱ)

(f+g)(P)=(D1(f+g)(P),,Dn(f+g)(P))=(D1f(P)+D1g(P),,Dnf(P)+Dng(P))=(D1f(P),,Dnf(P))+(D1g(P),,Dng(P))=f(P)+g(P)

 

proof ⅲ)

(fg)(P)=(D1(fg)(P),,Dn(fg)(P))=(D1f(P)g(P)+f(P)D1g(P),,Dnf(P)g(P)+f(P)Dng(P))=(D1f(P),,Dnf(P))g(P)+f(P)(D1g(P),,Dng(P))=f(P)g(P)+f(P)g(P)

 

  다변수함수의 미분 연산자 D(미분계수)는 미분 연산자 의 전치(transpose)에 불과하므로, 정리 5.2-2의 연산 특성을 그대로 따른다.

 

 

5.3. 벡터장의 미분연산자

 

  벡터장의 미분 연산자 Dv(방향 미분계수)의 연산 특성은 다음과 같다.

 

정리 5.3-1)  정의역의 점 P에서 미분 가능한 함수 F,G:RmRn에 대하여 다음이 성립한다.
  (ⅰ) cR,DcvF(P)=cDvF(P)=Dv(cF)(P)
  (ⅱ) Dv(F+G)(P)=DvF(P)+DvG(P)
  (ⅲ) Dv(FG)(P)=DvF(P)G(P)+F(P)DvG(P)
  (ⅳ) n=3 일 때, Dv(F×G)(P)=DvF(P)×G(P)+F(P)×DvG(P)

 

  정리 5.3-1의 (ⅲ)과 (ⅳ)는 각각 내적과 외적에 대한 정리이다. 벡터장은 결국 벡터이고, 벡터끼리의 '그냥 곱'은 일반적으로 정의되지 않으므로 '그냥 곱'에 대한 미분 연산도 없다. 그 대신 벡터끼리의 내적과 외적은 잘 정의되므로 이에 대한 미분 연산자의 연산 특성을 소개한다.

 

  증명에 앞서, 각 벡터장의 성분함수를 다음과 같이 쓰기로 하자.

F(P)=(f1(P),,fn(P)),G(P)=(g1(P),,gn(P))

  각 성분함수는 벡터장의 정의역에서 정의되고 공역이 1차원인 다변수함수이다.

 

proof ⅰ)

DcvF(P)=(Dcvf1(P),,Dcvfn(P))=(Dv(cf1)(P),,Dv(cfn)(P))=Dv(cF)(P)=(cDvf1(P),,cDvfn(P))=c(Dvf1(P),,Dvfn(P))=cDvF(P)

 

proof ⅱ)

Dv(F+G)(P)=(Dv(f1+g1)(P),,Dv(fn+gn)(P))=(Dvf1(P)+Dvg1(P),,Dvfn(P)+Dvgn(P))=(Dvf1(P),,Dvfn(P))+(Dvg1(P),,Dvgn(P))=DvF(P)+DvG(P)

 

proof ⅲ)

(FG)(P)={(f1,,fn)(g1,,gn)}(P)=(f1g1++fngn)(P)

Dv(FG)(P)=Dv(f1g1++fngn)(P)=Dv(f1g1)(P)++Dv(fngn)(P)=(Dvf1(P)g1(P)+f1(P)Dvg1(P))++(Dvfn(P)gn(P)+fn(P)Dvgn(P))=(Dvf1(P)g1(P)+Dvf2(P)g2(P)++Dvfn(P)gn(P))+(f1(P)Dvg1(P)+f2(P)Dvg2(P)++fn(P)Dvgn(P))=(Dvf1(P),,Dvfn(P))(g1(P),,gn(P))+(f1(P),,fn(P))(Dvg1(P),,Dvgn(P))=DvF(P)G(P)+F(P)DvG(P)

 

  알아차린 사람이 있겠지만, 사실 정리 5.3-1 (ⅲ)의 미분연산자 Dv는 벡터장이 아닌 다변수함수의 것이다. 서로 다른 대상이어도 공통된 특징을 찾아 일반화하여 연산자의 형태를 통일 하는 것이 유용함을 알 수 있는 예시이다.

 

proof ⅳ)

  주의: 이 증명은 본 포스팅 외의 행렬식에 대한 지식을 요구한다. 행렬식을 모르는 경우 넘어가도 좋다

 

  먼저, 다음과 같이 공역이 3차원 벡터의 내적을 정의한다.

(5.3-1)(x1,x2,x3)×(y1,y2,y3):=det(e1e2e3x1x2x3y1y2y3)

  식 (5.3-1)의 det()는 행렬식(determinant)를 의미한다. 행렬식의 미분은 다음과 같다.

ddtdet(a1a2a3b1b2b3c1c2c3)=det(da1dtda2dtda3dtb1b2b3c1c2c3)+det(a1a2a3db1dtdb2dtdb3dtc1c2c3)(5.3-2)+det(a1a2a3b1b2b3dc1dtdc2dtdc3dt)

 


  행렬식의 미분이 식 (5.3-2)와 같음을 알기 위해서는 치환(permutation)을 이용하는 행렬식의 정의를 이용하여야 한다.(일반적으로 잘 알려진 라플라스 전개로 표현된 행렬식으로는 행렬식의 미분을 유도하기 어렵다) 3×3 행렬에 대한 행렬식의 정의는 다음과 같다.

det(a11a12a13a21a22a23a31a32a33):=σS3sgn(σ)aσ(1)1aσ(2)2aσ(3)3

  행렬의 원소가 모두 일변수함수일 경우, 행렬식의 미분은 다음과 같음을 알 수 있다.

ddxdet(a11a12a13a21a22a23a31a32a33)=σS3sgn(σ)daσ(1)1dxaσ(2)2aσ(3)3+σS3sgn(σ)aσ(1)1daσ(2)2dxaσ(3)3+σS3sgn(σ)aσ(1)1aσ(2)2daσ(3)3dx=det(da11dxda12dxda13dxa21a22a23a31a32a33)+det(a11a12a13da21dxda22dxda23dxa31a32a33)+det(a11a12a13a21a22a23da31dxda32dxda33dx)

  따라서 식 (5.3-2)가 성립한다.


Dv(F×G)(P)=ddt|0(F×G)(P+tv)=ddt|0det(e1e2e3f1(P+tv)f2(P+tv)f3(P+tv)g1(P+tv)g2(P+tv)g3(P+tv))=det(e1e2e3ddt|0f1(P+tv)ddt|0f2(P+tv)ddt|0f3(P+tv)g1(P)g2(P)g3(P))+det(e1e2e3f1(P)f2(P)f3(P)ddt|0g1(P+tv)ddt|0g2(P+tv)ddt|0g3(P+tv))=det(e1e2e3Dvf1(P)Dvf2(P)Dvf3(P)g1(P)g2(P)g3(P))+det(e1e2e3f1(P)f2(P)f3(P)Dvg1(P)Dvg2(P)Dvg3(P))=(Dvf1(P),Dvf2(P),Dvf3(P))×(g1(P),g2(P),g3(P))+(f1(P),f2(P),f3(P))×(Dvg1(P),Dvg2(P),Dvg3(P))=DvF(P)×G(P)+F(P)×DvG(P)

 

  벡터장의 미분 연산자 Dk(k번째 편미분계수)는 미분 연산자 Dv의 특별한 경우이므로, 정리 5-2의 연산 특성을 그대로 따른다.

 

  벡터장의 미분 연산자 D(미분계수)의 연산 특성은 다음과 같다.

 

정리 5.3-2)  정의역의 점 P에서 미분 가능한 함수 F,G:RmRn에 대하여 다음이 성립한다.
  (ⅰ) cR,D(cF)(P)=cDF(P)
  (ⅱ) D(F+G)(P)=DF(P)+DG(P)
  (ⅲ) D(FG)(P)=DF(P)G(P)+F(P)DG(P)

 

  증명의 편의를 위해, 식 (3.1-9)와 같이 편미분계수 벡터를 이용하여 서술한다. 행렬을 모두 다 쓰는 것은 굉장히 오래걸리는 일이다.

 

proof ⅰ)

D(cF)(P)=(D1(cF)(P)Dm(cF)(P))=(cD1F(P)cDmF(P))=c(D1F(P)DmF(P))=cDF(P)

 

proof ⅱ)

D(F+G)(P)=(D1(F+G)(P)Dm(F+G)(P))=((D1F(P)+D1G(P))(DmF(P)+DmG(P)))=(D1F(P)DmF(P))+(D1G(P)DmG(P))=DF(P)+DG(P)

 

proof ⅲ)

D(FG)(P)=D(f1g1++fngn)(P)=D(f1g1)(P)++D(fngn)(P)=(Df1(P)g1(P)+f1(P)Dg1(P))++(Dfn(P)gn(P)+fn(P)Dgn(P))=(Df1(P)g1(P)+Df2(P)g2(P)++Dfn(P)gn(P))+(f1(P)Dg1(P)+f2(P)Dg2(P)++fn(P)Dgn(P))=(Df1(P),,Dfn(P))(g1(P),,gn(P))+(f1(P),,fn(P))(Dg1(P),,Dgn(P))=DF(P)G(P)+F(P)DG(P)

 

  마찬가지로, 정리 5.3-2 (ⅲ)도 다변수함수의 미분연산자 D에 대한 내용이다. 참고로 다음의 연산은 성립하지 않는다.

D(F×G)(P)=DF(P)×G(P)+F(P)×DG(P)

  그 이유는, 당연하게도 행렬과 벡터간의 외적 연산이 정의되지 않기 때문이다.

 

 

5.4. 곡선의 미분연산자

 

  곡선의 미분 연산자 D(미분계수)의 연산 특성은 다음과 같다.

정리 5.4-1)  정의역의 점 p에서 미분 가능한 함수 X,Y:RRn에 대하여 다음이 성립한다.
  (ⅰ) cR,D(cX)(p)=cDX(p)
  (ⅱ) D(X+Y)(p)=DX(p)+DG(p)
  (ⅲ) D(XY)(p)=DX(p)Y(p)+X(p)Y(p)
  (ⅳ) D(X×Y)(p)=DX(p)×Y(p)+X(p)×DY(p)

 

  증명에 앞서, 각 곡선의 성분함수를 다음과 같이 쓰기로 하자.
X(p)=(x1(p),,xn(p)),Y(p)=(y1(p),,yn(p))

 

proof ⅰ)

D(cX)(P)=(D(cx1)(p),,D(cxn)(p))=(cDx1(p),,cDxn(p))=c(Dx1(p),,Dxn(p))=cDX(p)

 

proof ⅱ)
D(X+Y)(p)=(D(x1+y1)(p),,D(xn+yn)(p))=(Dx1(p)+Dy1(p),,Dxn(p)+Dyn(p))=(Dx1(p),,Dxn(p))+(Dy1(p),,Dyn(p))=DX(p)+DG(p)

 

proof ⅲ)
D(XY)(P)=D(x1y1++xnyn)(P)=D(x1y1)(P)++D(xnyn)(P)=(Dx1(P)y1(P)+x1(P)Dy1(P))++(Dxn(P)yn(P)+xn(P)Dyn(P))=(Dx1(P)y1(P)+Dx2(P)y2(P)++Dxn(P)yn(P))+(x1(P)Dy1(P)+x2(P)Dy2(P)++xn(P)ygn(P))=(Dx1(P),,Dxn(P))(y1(P),,yn(P))+(x1(P),,xn(P))(Dy1(P),,Dyn(P))=DX(P)Y(P)+X(P)DY(P)

 

  마찬가지로, 정리 5.4-1 (ⅲ)도 일변수함수의 미분연산자 D에 대한 내용이다.

 

proof ⅳ)

D(X×Y)(p)=ddt|p(X×Y)(t)=ddt|pdet(e1e2e3x1(t)x2(t)x3(t)y1(t)y2(t)y3(t))=det(e1e2e3ddt|px1(t)ddt|px2(t)ddt|px3(t)y1(p)y2(p)y3(p))+det(e1e2e3x1(p)x2(p)x3(p)ddt|py1(t)ddt|py2(t)ddt|py3(t))=det(e1e2e3Dx1(p)Dx2(p)Dx3(p)y1(p)y2(p)y3(p))+det(e1e2e3x1(p)x2(p)x3(p)Dy1(p)Dy2(p)Dy3(p))=(Dx1(p),Dx2(p),Dx3(p))×(y1(p),y2(p),y3(p))+(x1(p),x2(p),x3(p))×(Dy1(p),Dy2(p),Dy3(p))=DX(p)×Y(p)+X(p)×DY(p)


다음 읽을거리: [미분의 정의부터 연쇄법칙까지] ch.6 연쇄법칙


댓글