Aerospace Kim

[다변수 미분] ch3. 연속미분가능

이전 읽을거리: ch2. 편미분

다음 읽을거리: ch4. 연쇄법칙


연속미분가능

 

  이번 포스팅에는 다음의 정리가 필요하다.

 

평균값 정리 (mean-value theorem)
  연속함수 $\phi:[a,b]\to\mathbb{R}$ 가 $(a,b)$ 의 각 점에서 미분가능하면 어떤 $c\in(a,b)$ 에 대해 다음이 성립한다.$$\phi(b)-\phi(a)=D\phi(c)(b-a)$$

 

  증명은 생략한다. (자세한 정보는 [FTC의 엄밀한 증명] ch22. 평균값 정리 참고)

 

Definition.  $f:A\in\mathcal{T}_{\mathbb{R}^m}\to\mathbb{R}^n$ 가 각 $a\in A$ 에서 미분가능하면 $f$ 가 미분가능하다고 한다.

 

※ $\mathcal{T}_{\mathbb{R}^m}$ 는 $\mathbb{R}^m$ 에서 열린집합의 모임이다.

 

  위 정의에 따르면 "미분가능함" 이 정의되는 함수의 정의역은 열린집합으로 제한된다. 이는 함수의 미분가능성이 정의역의 interior 의 점에서만 정의하기로 하였기 때문이다. 만약 정의역이 열린집합이 아니라면 미분가능성이 정의되지 않는 점이 존재하므로, 이를 피하기 위해 정의역 전체에서 미분가능한 함수는 정의역을 열린집합으로 제한한다.

 

  함수 $f:A\to Y$ 에 대해 $f$ 가 미분가능하여 $Df(a)$ 가 존재하는 점 $a\in A$ 의 집합을 $B$ 라고 하자. 이때 함수의 미분 $Df$ 를 정의역이 $B$ 인 일종의 함수로 생각할 수 있음은 아주 자연스럽다.

 

Definition.  $f:A\in\mathcal{T}_{\mathbb{R}^m}\to\mathbb{R}^n$ 에 대해 $A$ 의 모든 점에서 $f$ 의 모든 성분함수의 모든 편미분이 존재하여 $A$ 에서 연속이면 $f$ 가 연속미분가능하다(countinuously differentiable)고 한다.

 

  지난 포스팅에서 모든 $D_jf_i(a)$ 가 존재하는 것 만으로는 미분가능함이 보장되지 않음을 확인하였다. 위 정의는 이에 더해 모든 함수 $D_jf_i$ 가 연속이라는 조건이 더해졌는데, 이것으로 좋은 결과를 얻을 수 있다.

 

Lemma 3.1.  $f:A\in\mathcal{T}_{\mathbb{R}^m}\to\mathbb{R}$ 가 연속미분가능하면 미분가능하다.

 

  증명하기 전에 이 정리가 무엇을 의미하는지를 간단히 확인하자. 다음의 함수를 생각해보자.

$$f(x,y)=\text{sin}(xy)\quad g(x,y)=xy^2+e^{xy}$$

  미적분학을 공부해본 사람이라면 위의 두 함수가 미분가능함을 본능적으로 알 것이다. 사실 이 두 함수가 미분가능한 함수는 모든 편미분이 연속이기 때문임을 이 정리는 말하고 있다.

$$\frac{\partial f}{\partial x}(x,y)=y\text{cos}(xy)\quad\frac{\partial f}{\partial y}(x,y)=x\text{cos}(xy)$$

$$\frac{\partial g}{\partial x}(x,y)=y^2+ye^{xy}\quad\frac{\partial g}{\partial y}(x,y)=2xy+xe^{xy}$$

  이제 정리를 증명하자.

 

  Proof.  임의의 $a\in A$ 를 생각하자. 각 $D_jf$ 는 $a$ 에서 연속이므로 $\displaystyle\lim_{x\to a}D_jf(x)=D_jf(a)$ 가 성립한다. 따라서 임의의 $\epsilon>0$ 에 대해 각 $\delta_1,\ldots,\delta_m>0$ 이 존재하여 임의의 $x\in A$ 에 대해 다음이 성립한다.

$$\begin{gather}0<|x-a|<\delta_1\Rightarrow|D_1f(x)-D_1f(a)|<\frac{\epsilon}{m}\\\vdots\\0<|x-a|<\delta_m\Rightarrow|D_mf(x)-D_mf(a)|<\frac{\epsilon}{m}\end{gather}$$

  $\delta=\text{min}\{\delta_1,\ldots,\delta_m\}$ 이라고 하면 임의의 $x\in A$ 에 대해 다음이 성립한다.

$$0<|x-a|<\delta\Rightarrow\left\{\begin{matrix}\displaystyle|D_1f(x)-D_1f(a)|<\frac{\epsilon}{m}\\\vdots\\\displaystyle|D_mf(x)-D_mf(a)|<\frac{\epsilon}{m}\end{matrix}\right.$$

  $x=(x_1,\ldots,x_m)$ , $a=(a_1,\ldots,a_m)$ 이라고 할때 다음과 같이 $z_0,z_1,\ldots,z_m\in\mathbb{R}^m$ 을 정의하자.

$$z_0=a,\quad z_i=(x_1,\ldots,x_i,a_{i+1},\ldots,a_m)$$

  $z_m=x$ 이므로 다음과 같다.

$$f(x)-f(a)=\sum_{j=1}^m\big(f(z_j)-f(z_{j-1})\big)$$

  $B=\begin{pmatrix}D_1f(a)&\cdots&D_mf(a)\end{pmatrix}$ 라고 하면 다음이 성립한다.

$$\because B(x-a)=\sum_{j=1}^mD_jf(a)(x_j-a_j)$$

$$\begin{align}&\;|f(x)-f(a)-B(x-a)|\\=&\;\left|\sum_{j=1}^m\Big(f(z_j)-f(z_{j-1})+D_jf(a)(x_j-a_j)\Big)\right|\\\le&
\;\sum_{j=1}^m\Big|f(z_j)-f(z_{j-1})+D_jf(a)(x_j-a_j)\Big|\end{align}$$

  $x_i\neq a_i$ 라고 가정하자. 다음의 함수를 생각하자.

$$\phi:[0,x_i-a_i]\to\mathbb{R},\;\;\phi(t)=f(z_{i-1}+te_i)$$

  임의의 $t_0\in(0,x_i-a_i)$ 에 대해 다음이 성립한다.

$$\begin{align}&\;\lim_{t\to 0}\frac{\phi(t_0+t)-\phi(t_0)}{t}\\=&\;\lim_{t\to 0}\frac{f(z_{i-1}+t_0e_i+te_i)-f(z_{i-1}+t_0e_i)}{t}\\=&\;D_if(z_{i-1}+t_0e_i)\end{align}$$

  따라서 $D\phi(t_0)=D_if(z_{i-1}+t_0e_i)$ 이며 $\phi$ 는 $(0,x_i-a_i)$ 의 각 점에서 미분가능하다. 평균값 정리에 따르면 어떤 $t_i\in(0,x_i-a_i)$ 에 대해 다음이 성립한다.

$$\phi(x_i-a_i)-\phi(0)=D\phi(t_i)(x_i-a_i)$$

  이때 $z_{i-1}+(x_i-a_i)e_i=z_i$ 이고 $D\phi(t_i)=D_if(z_{i-1}+t_ie_i)$ 이므로 다음이 성립한다.

$$f(z_i)-f(z_{i-1})=D_if(z_{i-1}+t_ie_i)(x_i-a_i)\tag{1}$$

  만약 $x_i=a_i$ 인 경우에는 $t_i=0$ 이라고 하면 식 (1)이 성립한다. 정리하면 식 (1)은 어떤 $t_i\in[0,x_i-a_i]$ 에 대해 반드시 성립한다. $z_{i-1}+t_ie_i=c_i$ 라고 하자. 다음이 성립한다.

$$\begin{align}|c_i-a|&=|z_{i-1}+t_ie_i-a|\\&=|(x_1-a_1,\ldots,x_{i-1}-a_{i-1},t_i,0,\ldots,0)|\end{align}$$

  한편 $|t_i|\le|x_i-a_i|$ 이므로 $|c_i-a|\le|x-a|$ 가 성립한다. 즉 $|c_i-a|<\delta$ 이므로 $c_i\neq a$ 라면 다음 부등식이 성립한다.

$$|D_if(c_i)-D_if(a)|<\frac{\epsilon}{m}\tag{2}$$

  한편 $a_i=a$ 이면 $D_if(c_i)=D_if(a)$ 이므로 식 (2)는 항상 성립한다. 다음이 성립한다.

$$\begin{align}&\;|f(x)-f(a)-B(x-a)|\\\le&\;\sum_{j=1}^m\Big|f(z_i)-f(z_{i-1})-D_jf(a)(x_j-a_j)\Big|\\=&\;\sum_{j=1}^m\left|\Big(D_jf(c_j)-D_jf(a)\Big)(x_j-a_j)\right|\\\le&\;\sum_{j=1}^m\Big|D_jf(c_j)-D_jf(a)\Big||x_i-a_j|\\<&\;\sum_{j=1}^m\frac{\epsilon}{m}|x-a|\\=&\;\epsilon|x-a|\end{align}$$

  정리하면 임의의 $x\in A$ 에 대해 다음이 성립한다.

$$\begin{align}0<|x-a|<\delta&\Rightarrow\frac{|f(x)-f(a)-B(x-a)|}{|x-a|}<\epsilon\\&\Leftrightarrow\left|\frac{f(x)-f(a)-B(x-a)}{|x-a|}\right|<\epsilon\end{align}$$

$$\therefore\lim_{x\to a}\frac{f(x)-f(a)-B(x-a)}{|x-a|}=0$$

  따라서 $f$ 는 미분가능하다.   $\square$

 

 

Theorem 3.2.  $f:A\in\mathcal{T}_{\mathbb{R}^m}\to\mathbb{R}^n$ 가 연속미분가능하면 미분가능하다.

 

  Proof.  $f$ 가 연속미분가능하면 $f$ 의 각 성분함수도 연속미분가능하다. 도움정리 3.1.에 따라 $f$ 의 각 성분함수는 미분가능하며, 정리 2.2.에 따라 $f$ 는 미분가능하다.   $\square$

 

 

함수의 class

 

  연속미분가능성의 개념을 확장해보자.

 

Definition.  함수 $f$ 가 연속미분가능하면 $f$ 가 $C^1$ 급이라고 한다.

 

※ "$f$ 가 $C^1$ 급 이다" 의 원문은 "$f$ is of class $C^1$" 이다.

 

Definition.  $f:A\in\mathcal{T}_{\mathbb{R}^m}\to\mathbb{R}^n$ 에 대해 $A$ 의 모든 점에서 $f$ 의 모든 성분함수의 모든 편미분이 존재하여 $A$ 에서 연속이면 $f$ 가 $C^r$ 급이라고 한다.

 

  예를들어 각각 임의의 변수로 두 번 편미분 가능하며, 그렇게 얻어낸 함수가 연속이면 $C^2$ 급인 것이다. 도움정리 3.1. 아래의 두 함수는 $C^1$ 급이며 동시에 $C^2$ 급이기도 하고, 더 나아가 임의의 $n\in\mathbb{N}$ 에 대해 $C^n$ 급임을 직감으로 알 수 있다.

 

Definition.  함수 $f$ 가 임의의 $n\in\mathbb{N}$ 에 대해 $C^n$ 급이면 $C^\infty$ 급이라고 한다.

 

Theorem 3.3.  함수 $f$ 가 $C^r$ 급일 필요충분조건은 $f$ 의 모든 성분함수의 모든 편미분이 $C^{r-1}$ 급인 것이다.

 

  Proof.  $f$ 가 $C^r$ 급이면 $f$ 의 모든 성분함수의 모든 $r$ 계 편미분이 연속이다. 한편 $f$ 의 성분함수의 $r$ 계 편미분이 연속임은 $f$ 의 성분함수의 편미분의 $r-1$ 계 편미분이 연속이라는 것이다. 따라서 $f$ 의 모든 성분함수의 모든 편미분은 $C^{r-1}$ 급임을 얻는다. 역으로 $f$ 의 모든 성분함수의 모든 편미분이 $C^{r-1}$ 급이면 $f$ 의 모든 성분함수의 모든 편미분의 $r-1$ 계 편미분이 연속이므로 $f$ 의 모든 성분함수의 모든 $r$ 계 편미분이 연속이다. 따라서 $f$ 가 $C^r$ 급임을 얻는다.   $\square$

 

 

클레로 정리

 

  다음의 정리는 $C^2$ 급 함수의 편미분에 대해 교환법칙이 성립함을 의미한다.

 

클레로 정리 (Clairaut's theorem)
  $C^2$ 급함수 $f:A\in\mathcal{T}_{\mathbb{R}^m}\to\mathbb{R}$ 와 임의의 $i,j\in\{1,\ldots,m\}$ , 각 $a\in A$ 에 대해 다음이 성립한다.$$D_jD_if(a)=D_iD_jf(a)$$

 

 

  Proof.  $i=j$ 인 경우에 정리가 자명하게 성립한다. $i<j$ 인 경우에 대해 생각하자. 편의상 $i=1$ , $j=2$ 라고 하자. (다른 경우에도 증명은 동일하다) $a'=(a_2,\ldots,a_m)$ 이라고 하면 정의에 따라 다음과 같다.

$$\begin{align}&\;D_2f(x,a_2,a')-D_2f(a_1,a_2,a')\\=&\;\lim_{y\to a_2}\frac{f(x,y,a')-f(x,a_2,a')}{y-a_2}-\lim_{y\to a_2}\frac{f(a_1,y,a')-f(a_1,a_2,a')}{y-a_2}\\=&\;\lim_{y\to a_2}\left(\frac{f(x,y,a')-f(x,a_2,a')}{y-a_2}-\frac{f(a_1,y,a')-f(a_1,a_2,a')}{y-a_2}\right)\\=&\;\lim_{y\to a_2}\frac{f(x,y,a')-f(x,a_2,a')-f(a_1,y,a')+f(a_1,a_2,a')}{y-a_2}\end{align}$$

  따라서 다음을 얻는다.

$$\begin{align}&\;D_1D_2f(a_1,a_2,a')\\=&\;\lim_{x\to a_1}\frac{1}{x-a_1}\Big(D_2f(x,a_2,a')-D_2f(a_1,a_2,a')\Big)\\=&\;\lim_{x\to a_1}\frac{1}{x-a_1}\lim_{y\to a_2}\frac{f(x,y,a')-f(x,a_2,a')-f(a_1,y,a')+f(a_1,a_2,a')}{y-a_2}\\=&\;\lim_{x\to a_1}\lim_{y\to a_2}\frac{f(x,y,a')-f(x,a_2,a')-f(a_1,y,a')+f(a_1,a_2,a')}{(x-a_1)(y-a_2)}\end{align}$$

  $x\neq a_1$ , $y\neq a_2$ 인 $(x,y,a')\in A$ 를 고정하자. $f$ 는 $C^2$ 급이므로 함수 $g(t)=f(t,y,a')-f(t,a_2,a')$ 는 미분가능하며, 특히 $(a_1,x)$ 에서 미분가능하다. 평균값 정리에 따라 어떤 $c_x\in(a_1,x)$ 가 존재하여 다음이 성립한다.

$$\begin{align}&\;g(x)-g(a)\\=&\;Dg(c_x)(x-a)\\=&\;\big(D_1f(c_x,y,a')-D_1f(c_x,a_2,a')\big)(x-a_1)\end{align}$$

  $\displaystyle\lim_{x\to a}c_x=a_1$ 임을 보이자. 임의의 $\epsilon>0$ 에 대해 $\delta=\epsilon$ 이라고 하자. $0<|x-a_1|<\delta$ 인 임의의 $x$ 에 대해 $c_x\in(a_1,x)$ 이므로 $|c_x-a_1|<|x-a_1|$ 가 성립한다. 즉 $|c_x-a_1|<\epsilon$ 이므로 원하는 결과를 얻는다. 한편 다음이 성립한다.

$$\begin{align}&\;g(x)-g(a)\\=&\;f(x,y,a')-f(x,a_2,a')-f(a_1,y,a')+f(a_1,a_2,a')\end{align}$$

  따라서 다음을 얻는다.

$$\begin{align}&\;D_1D_2f(a_1,a_2,a')\\=&\;\lim_{x\to a_1}\lim_{y\to a_2}\frac{\big(D_1f(c_x,y,a')-D_1f(c_x,a_2,a')\big)(x-a_1)}{(x-a_1)(y-a_2)}\\=&\;\lim_{x\to a_1}\lim_{y\to a_2}\frac{D_1f(c_x,y,a')-D_1f(c_x,a_2,a')}{y-a_2}\end{align}$$

  한편 정의에 따라 다음과 같다.

$$\lim_{y\to a_2}\frac{D_1f(c_x,y,a')-D_1f(c_x,a_2,a')}{y-a_2}=D_2D_1f(c_x,a_2,a')$$

  따라서 $\displaystyle D_1D_2f(a_1,a_2,a')=\lim_{x\to a_1}D_2D_1f(c_x,a_2,a')$ 를 얻는다. 이때 $D_2D_1f$ 는 연속이므로 극한의 성질(링크의 정리 5.5.와 정리 5.3.)에 따라 다음이 성립한다.

$$\begin{align}&\;\lim_{x\to a_1}D_2D_1f(c_x,a_2,\ldots,a_m)\\=&\;D_2D_1f\left(\lim_{x\to a_1}c_x,\lim_{x\to a_1}a_2,\ldots,\lim_{x\to a_1}a_m\right)\\=&\;D_2D_1f(a_1,a_2,\ldots,a_m)\end{align}$$

$$\therefore D_1D_2f(a)=D_2D_1f(a)\tag*{$\square$}$$

 

 

읽어주셔서 감사합니다.

 

 

References)

[1] James R. Munkres. (1991). Analysis on manifolds. CRC press.


이전 읽을거리: ch2. 편미분

다음 읽을거리: ch4. 연쇄법칙


댓글