Aerospace Kim

[미분의 정의부터 연쇄법칙까지] ch.2 다변수 미분

이전 읽을거리:

[미분의 정의부터 연쇄법칙까지] ch.0 미분이란?

[미분의 정의부터 연쇄법칙까지] ch.1 일변수 미분


  본 포스팅은 PC chrome 환경에 최적화되어있습니다.

 

  본 포스팅에서는 미분의 의미부터 연쇄법칙의 유도까지 아주 상세하게 설명한다. 연쇄법칙의 원리를 아는 것의 가치는 태평양을 표류할 때의 나침반의 가치와 같다. 천천히, 꼼꼼하게 내용을 공부한다면, 연쇄법칙의 겉모양만 보고 기계적으로 연산하는 당신에게 커다란 통찰을 안겨줄 것이다. 이해가 안되거나 설명이 잘못되었다고 생각이 드는 부분이 있다면 얼마든지 댓글로 질문을 남겨주시기를 부탁드린다.

 

 

2. 다변수 미분

 

  진정한 의미의 다변수함수의 도함수를 정의하기 전에, 다음을 정의하자.

 

정의)  열린 집합 $U\subset\mathbb{R^n}$ 에서 정의된 함수 $f:U\to\mathbb{R}$ 과 점 $P\in U$ 및 벡터 $\vec{v}$ 에 대하여, 다음의 극한값$$D_{\vec{v}}f(P):=\lim_{t\to 0}\frac{f(P+t\vec{v})-f(P)}{t}\iff\left.\frac{d}{dt}\right|_0f(P+t\vec{v})\tag{2-1}$$  가 존재하면 이 값을 점 $P$ 에서 $f$ 의 $\vec{\mathbf{v}}$-방향 순간변화율 이라고 한다.

 

  기호 $\left.\frac{d}{dt}\right|_0$ 의 의미는 t에 대해 미분한 다음 t에 0을 대입한다는 의미이다.

  만약 벡터 $\vec{v}$ 를 단위벡터(크기가 1인 벡터)에 한정하여 생각한다면, $\vec{v}$-방향 순간변화율의 의미는 점 $(P,f(P))$ 에서 $f$ 의 그래프의 $\vec{v}$ 방향의 기울기를 의미한다. 기울기를 의미한다는 점에서, $D_{\vec{v}}f(P)$ 를 점 $P$ 에서 $f$ 의 $\vec{\mathbf{v}}$-방향 미분계수라고도 한다.

 

  이해를 돕기 위해서, 아래의 예시를 보자.

 


  위의 그림은 영역 $(-5,5)\times(-5,5)\subset\mathbb{R^2}$ 에서 정의된 함수 $f(x,y)=x^2+y^2$ 의 3차원 그래프이다. 이 그래프의 점 $(1,1,f(1,1))$ 에서 $(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}})$ 방향의 기울기는 $(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}})$-방향 순간변화율로, 다음과 같이 계산할 수 있다.

$$\begin{align}D_{\left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}}\right)}f(1,1)&=\lim_{t\to 0}\frac{f\left((1,1)+t\left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}}\right)\right)-f(1,1)}{t}\\&=\lim_{t\to 0}\frac{f\left(1+t\frac{1}{\sqrt{2}},1+t\frac{1}{\sqrt{2}}\right)-f(1,1)}{t}\\&=\lim_{t\to 0}\frac{2\left(1+\frac{t}{\sqrt{2}}\right)^2-2}{t}\\&=\lim_{t\to 0}\frac{\frac{4}{\sqrt{2}}t+t^2}{t}=2\sqrt{2}\end{align}$$

  또는 간편하게, 일변수함수들의 잘 알려진 미분법을 활용하여 다음과 같이 계산할 수도 있다.

$$\begin{align}D_{\left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}}\right)}f(1,1)&=\left.\frac{d}{dt}\right|_0 f\left((1,1)+t\left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}}\right)\right)\\&=\left.\frac{d}{dt}\right|_0f\left(1+t\frac{1}{\sqrt{2}},1+t\frac{1}{\sqrt{2}}\right)\\&=\left.\frac{d}{dt}\right|_0\left\{2\left(1+\frac{t}{\sqrt{2}}\right)^2\right\}\\&=\left.4\left(1+\frac{t}{\sqrt{2}}\right)\frac{1}{\sqrt{2}}\right|_0=2\sqrt{2}\end{align}$$

  추가로, 이 그래프의 점 $(1,1,f(1,1))$ 에서 $(\frac{1}{\sqrt{2}},-\frac{1}{\sqrt{2}})$ 방향의 기울기는 다음과 같이 0임을 알 수 있다. 이는 직관적으로 그래프의 둘레를 따라 평평하게 도는 방향이므로 0임이 자명하기도 하다.

$$\begin{align}D_{\left(\frac{1}{\sqrt{2}},-\frac{1}{\sqrt{2}}\right)}f(1,1)&=\left.\frac{d}{dt}\right|_0 f\left((1,1)+t\left(\frac{1}{\sqrt{2}},-\frac{1}{\sqrt{2}}\right)\right)\\&=\left.\frac{d}{dt}\right|_0f\left(1+t\frac{1}{\sqrt{2}},1-t\frac{1}{\sqrt{2}}\right)\\&=\left.\frac{d}{dt}\right|_0\left\{\left(1+\frac{t}{\sqrt{2}}\right)^2+\left(1-\frac{t}{\sqrt{2}}\right)^2\right\}\\&=\left.\left\{2\left(1+\frac{t}{\sqrt{2}}\right)\frac{1}{\sqrt{2}}+2\left(1-\frac{t}{\sqrt{2}}\right)\left(-\frac{1}{\sqrt{2}}\right)\right\}\right|_0=0\end{align}$$


 

  위에서 살펴보았듯이, 다변수함수의 미분은 기준이 되는 방향으로 연산하는 것임을 알았다. 여기서 잠시, n차원 공간에는 특별한 n개의 방향, 표준단위벡터가 있음을 상기하자.

$$\begin{align}\vec{e_1}&=(1,0,0,\ldots,0,0)\\ \vec{e_2}&=(0,1,0,\ldots,0,0)\\ \vdots &\\ \vec{e_n}&=(0,0,0,\ldots,0,1)\end{align}$$

  이러한 '특별한' 방향으로의 미분은 앞으로 자주 이용하게 된다. 그러므로 특별히 다음과 같이 정의한다.

 

정의)  점 $P=(p_1,\ldots,p_n)\in U$에서 함수 $f:U\to\mathbb{R}$의 $\vec{e_k}$-방향 미분계수 $D_{\vec{e_k}}f(P)$를 단순히 $\mathbf{D}_{\mathbf{k}}\mathbf{f(P)}$로 쓰기로 하고, 이를 점 $P$에서 $f$의 $\mathbf{k}$번째 편미분계수 라고 정의한다.

 

  방향 미분계수의 정의에 따라, 다음과 같이 쓸 수 있다.

$$D_{k}f(P)=\left.\frac{d}{dt}\right|_0 f(p_1,\ldots,p_k+t,\ldots,p_n)$$

  따라서 $D_k f(P)$ 는 점 $P=(p_1,\ldots,p_k,\ldots,p_n)$ 의 k번째 성분값만 변화시켜 얻은 변화율임을 확인할 수 있다. 이러한 맥락에서, 편미분계수를 다음과 같이 쓸 수 있다.

$$D_kf\iff\frac{\partial f}{\partial x_k}\iff\partial_{x_k}f$$

  이는 복잡한 편미분계수 연산에서 유용하게 쓸 수 있으나, 정확한 의미를 모른다면 쓰지 말자! 오히려 혼란만 가중될 것이다. 다시 설명하자면, $\frac{\partial f}{\partial x_k}$ 란 함수 $f$의 '표준직교좌표'의 $k$ 번째 성분인 $x_k$ 의 변화에 대한 순간변화율의 의미이다. 예를 들면, 다음과 같다.

$$f(x,y)=x^2 y+xy^2$$

$$D_1f(x,y)=\frac{\partial f}{\partial x}(x,y)=2xy+y^2\quad D_2f(x,y)=\frac{\partial f}{\partial y}(x,y)=x^2+2xy$$

$$g(\alpha,\beta)=\alpha\sin(\beta)$$

$$D_1g(\alpha,\beta)=\frac{\partial g}{\partial \alpha}(\alpha,\beta)=\sin(\beta)\quad D_2 g(\alpha,\beta)=\frac{\partial g}{\partial\beta}(\alpha,\beta)=\alpha\cos(\beta)$$

  편미분계수의 기호 $\partial/\partial x_k$ 를 쓰기 위해서는 함수의 좌표계가 표준직교좌표계로 주어졌는지를 꼭 확인해야 한다. 가령 극좌표와 같이 표준직교좌표가 아닌 것은 편미분 기호를 매우 조심스럽게 사용하여야 한다. 표준직교좌표란 대략적으로, 좌표평면의 격자점과 같이 공간상의 한 점을 정직하게 나타내는 것을 의미한다. 만약 표준직교좌표가 아닌 다른 좌표로 무작정 편미분 해버린다면, 이는 왜곡이 심한 평면지도에서 비행거리를 측정하는 것이나 다름없다.

 

왜곡이 심한 지도. 이 지도만 보면 남극의 둘레와 적도의 둘레가 같아 보인다.

 

  다음과 같이 정의하고 가자.

 

정의)  함수 $f$ 가 점 $P$ 에서 모든 편미분계수(첫 번째 편미분계수, ... , n번째 편미분계수 모두)가 존재하면, $f$ 는 $\mathbf{P}$ 에서 편미분 가능하다고 한다.

 

  만약 함수 $f$ 가 편미분 가능한 함수라는 것은 함수 $f$ 가 정의된 열린 집합 $U$ (정의역)의 모든 점 $p$ 에서 편미분 가능하다는 것이다.

 

정의)  함수 $f$ 가 정의역 $U$ 의 모든 점에서 $k$ 번째 편미분계수를 가지면 함수$$D_kf:U\to\mathbb{R},\;P\mapsto D_k f(P)$$  를 $f$ 의 $\mathbf{k}$ 번째 편도함수(partial derivative)라고 한다.

 

 

2.1. 미분 가능 함수 (다변수)

 

  '1.1 미분 가능 함수 (일변수)' 에서 보다시피, 어떤 함수 $f$ 가 어떤 점 $p$ 에서 미분 가능한지 확인하기 위해서는 점 $p$ 에서 함수 $f$ 에 '접하는' '직선'이 존재하는지를 확인하였다. 또한 '1.2 일차 함수'로부터 직선이 의미하는 일반적인 의미를 파악하고, 직선이 일차함수의 일종임을 확인하였다. 다변수에서도 이를 똑같이 적용할 것이다.

  일반화 하여, 함수의 미분가능성을 다음과 같이 정의한다.

 

정의)  열린 영역 $U\in\mathbb{R^m}$ 에서 정의된 함수 $f:U\to\mathbb{R^n}$ 이 점 $P\in U$ 에서 접하는 일차함수 $l:U\to\mathbb{R^n}$ 을 가진다면 함수 $f$ 는 점 $P$ 에서 미분 가능하다고 한다.

 

  일차함수 $l(X)$ 가 $X=P$일때 $f(X)$ 와 '접한다'는 뜻은 점 $P$ 근방에서 $f(X)$ 와 $l(X)$ 의 차이가 0에 근접하는 속도가 $X$ 와 $P$ 의 차이가 0에 근접하는 속도보다 빠르다는 것을 의미한다. 수식으로 나타내면 식 (1.1-2)와 비슷하게, 다음과 같다.

$$\lim_{X\to P}\frac{\left|f(X)-l(X)\right|}{\left|X-P\right|}=0\tag{2.1-1}$$

  이 때, 일차함수는 점 $P$ 에서 접하기 이전에, 점 $P$ 에서 $f(P)=l(P)$ 이어야 한다. 그리고 지금은 함수 $f$ 의 공역이 1차원일 때에 관심이 있으므로, 일차함수의 정의와 정리 1.2-5에 따라 다음과 같다.

$$l(P)=l(P)+L(P-P)=l(P)=f(P)$$

$$\therefore l(X)=f(P)+L(X-P)=f(P)+\vec{a}\cdot(X-P)\quad(\vec{a}\in\mathbb{R^m})$$

  그러므로 미분 가능의 정의를 다시 쓰면,

$$\lim_{X\to P}\frac{f(X)-\left\{f(P)+\vec{a}\cdot(X-P)\right\}}{\left|X-P\right|}=0\tag{2.1-2}$$

  위의 식을 만족시키는 벡터 $\vec{a}$ 가 존재한다면 함수 $f$ 는 점 $P$ 에서 미분 가능한 것이다. 식 (2.1-2)에서 $X=P+\vec{v}$ 로 치환하면 다음과 같이 쓸 수도 있다.

$$\lim_{\vec{v}\to\vec{0}}\frac{f(P+\vec{v})-f(P)-\vec{a}\cdot\vec{v}}{\left|\vec{v}\right|}\tag{2.1-3}$$

 

  만약 함수 $f$ 가 미분 가능한 함수라는 것은 함수 $f$ 가 정의된 열린 집합 $U$ (정의역)의 모든 점 $P$ 에서 미분 가능하다는 것이다.

 

  이해를 돕기 위해서, 아래의 예시를 보자.

 


어떤 벡터 $\vec{b}\in\mathbb{R_n}$ 에 대해, $f(X):=\vec{b}\cdot X$ 로 정의된 함수 $f$ 가 미분 가능함을 보여라.

 

proof)

  모든 점 $X\in\mathbb{R^n}$ 에 대해,

$$\begin{align}\lim_{\vec{v}\to\vec{0}}\frac{f(X+\vec{v})-f(X)-\vec{a}\cdot\vec{v}}{\left|\vec{v}\right|}&=\lim_{\vec{v}\to\vec{0}}\frac{\vec{b}\cdot(X+\vec{v})-\vec{b}\cdot X-\vec{a}\cdot\vec{v}}{\left|\vec{v}\right|}\\&=\lim_{\vec{v}\to\vec{0}}\frac{(\vec{b}-\vec{a})\cdot\vec{v}}{\left|\vec{v}\right|}=0\end{align}$$

  을 만족시키는 벡터 $\vec{a}$ 가 존재함을 보이면 된다. 벡터 $\vec{v}=t\vec{e}$ 와 같이 치환하자. 여기서 $\vec{e}$ 는 임의의 단위벡터를 의미한다고 하자.

$$\begin{align}\lim_{t\to 0}\frac{(\vec{b}-\vec{a})\cdot(t\vec{e})}{\left|t\vec{e}\right|}&=\lim_{t\to 0}\frac{(\vec{b}-\vec{a})\cdot(t\vec{e})}{\left|t\vec{e}\right|}\\&=\lim_{t\to 0}\frac{t(\vec{b}-\vec{a})\cdot\vec{e}}{t\left|\vec{e}\right|}\\&=(\vec{b}-\vec{a})\cdot\vec{e}=0\end{align}$$

  임의의 단위벡터 $\vec{e}$ 에 대해 위의 마지막 등식을 만족시키기 위해서는 벡터 $\vec{a}$ 가 주어진 벡터 $\vec{b}$ 이면 된다. 따라서 함수 $f$ 는 정의역의 모든 점에서 미분 가능하다. 다시말해, 함수 $f$ 는 미분 가능하다.   $\square$


 

  미분 가능성을 확인하기 위해 벡터 $\vec{a}$ 의 존재성을 확인하는 것 만으로도 벡터 $\vec{a}$ 의 의의가 있지만, 벡터 $\vec{a}$ 가 구체적으로 무엇인지를 아는 것도 재밌는 결과를 낳는다.

 

 

2.2. 도함수 (derivative)

 

  먼저, 다음과 같이 새로운 벡터를 정의하자.

 

정의)  열린 영역 $U\subset\mathbb{R^n}$ 에서 정의된 편미분가능한 함수 $f:U\to\mathbb{R^n}$ 에 대해$$\mathrm{grad}\;f(P):=\Bigl(D_1 f(P),\ldots,D_n f(P)\Bigr)$$  를 점 $P$ 에서 $f$ 의 gradient vector 또는 기울기벡터라고 정의한다.

 

  이 벡터를 '기울기벡터'라고 부르는 이유는 잠시 뒤에 설명된다. 기울기벡터를 다음과 같이 쓰기도 한다.

$$\nabla f(P):=\mathrm{grad}\;f(P)$$

  '$\nabla$'는 del, 또는 nabla라고 읽는다.

 

  다시 돌아와서, 미분 가능성 판단하는 벡터 $\vec{a}$ 가 어떤 값을 갖는지 다시 알아보도록 하자. 먼저, 어떤 함수 $f$ 가 미분 가능한 함수라고 하자. 그리하면 벡터 $\vec{a}$ 에 대하여 식 (2.1-3)를 다음과 같이 쓸 수 있다.

$$\lim_{\vec{v}\to\vec{0}}\frac{f(P+\vec{v})-f(P)}{\left|\vec{v}\right|}=\lim_{\vec{v}\to\vec{0}}\frac{\vec{a}\cdot\vec{v}}{\left|\vec{v}\right|}\tag{2.2-1}$$

  벡터 $\vec{v}=t\vec{u}$ 와 같이 치환하자. $\vec{u}$ 는 임의의 고정된 벡터, $t$ 는 0으로 수렴하는 실수이다. 식 (2.2-1)의 우변은 다음과 같다.

$$\lim_{t\to 0}\frac{\vec{a}\cdot(t\vec{u})}{\left|t\vec{u}\right|}=\lim_{t\to 0}\frac{t\vec{a}\cdot\vec{u}}{t\left|\vec{u}\right|}=\vec{a}\cdot\frac{\vec{u}}{\left|\vec{u}\right|}=\frac{1}{\left|\vec{u}\right|}(\vec{a}\cdot\vec{u})\tag{2.2-2}$$

  식 (2.2-1)의 좌변은 다음과 같다.

$$\lim_{t\to 0}\frac{f(P+t\vec{u})-f(P)}{\left|t\vec{u}\right|}=\frac{1}{\left|\vec{u}\right|}\lim_{t\to 0}\frac{f(P+t\vec{u})-f(P)}{t}\tag{2.2-3}$$

  여기서 식 (2.2-3)의 일부는 $\vec{u}$-방향 미분계수의 정의와 일치함을 알 수 있다. 식 (2.2-2)와 함께 정리하면 다음과 같다.

$$D_{\vec{u}}f(P)=\vec{a}\cdot\vec{u}\tag{2.2-4}$$

  n차원 벡터 $\vec{a}:=(a_1,a_2,\ldots,a_n)$ 이라고 하자. 특히, 표준단위벡터 $\vec{e_k}$ 에 대해 다음과 같음을 알고 있다.

$$\vec{a}\cdot\vec{e_k}=(a_1,\ldots,a_k,\ldots,a_n)\cdot(0,\ldots,1,\ldots,0)=a_k$$

  식 (2.2-4)에서 임의의 벡터 $\vec{u}$ 대신, 특별한 방향의 단위벡터 $\vec{e_k}$ 를 대입하면 다음과 같다.

$$D_{\vec{e_k}}f(P)=\vec{a}\cdot\vec{e_k}\iff D_k f(P)=a_k$$

  따라서 벡터 $\vec{a}$ 는 다음과 같음을 알 수 있다.

$$\vec{a}=(a_1,a_2,\ldots,a_n)=\Bigl(D_1 f(P),D_2 f(P),\ldots,D_n f(P)\Bigr)\tag{2.2-5}$$

  여기서 식 (2.2-5)는 함수 $f$ 의 점 $P$ 에서의 기울기벡터의 의미와 일치한다. 따라서 다음과 같다.

$$\vec{a}=\nabla f(P)$$

  정리하면, 미분 가능한 다변수함수 $f$ 는 다음의 식을 만족하는 함수를 의미하는 것이다.

$$\forall P\in U\subset\mathbb{R^n},\quad\lim_{\vec{v}\to\vec{0}}\frac{f(P+\vec{v})-f(P)-{\color{red}{\nabla f(P)}} \cdot\vec{v}}{\left|\vec{v}\right|}=0\tag{2.2-6}$$

 

  여기서 잠시, 정리 1.1-1에서 미분 가능한 일변수함수 $f$ 는 다음의 식을 만족함을 안다.

$$\forall p\in U\subset\mathbb{R},\quad\lim_{t\to 0}\frac{f(p+t)-f(p)-{\textcolor{red}{f'(p)}}t}{t}=0$$

  빨간색으로 강조해둔 부분을 유심히 보자. 그리하면, 직감적으로 $\nabla f$ 가 함수 $f$ 의 일반적인 미분 형태를 의미한다는 것을 알아차릴 수 있다. 다변수함수의 편미분계수같은 것이 아니라, 진정한 의미의 미분계수를 말이다. 따라서 $\nabla f(P)$ 는 점 $P$ 에서 함수 $f$ 의 기울기를 대변하는 벡터라고 말할 수 있다. 이것이 $\nabla f$ 에게 '기울기벡터'라는 이름을 붙인 이유이다. 또한 다변수함수의 미분계수는 일변수함수의 미분계수와는 달리, 벡터의 형태임을 알 수 있다.

 


  다만, 일변수함수의 경우에는 미분 변수($t$)와 그냥 곱해져있으며 다변수함수의 경우에는 미분 변수($\vec{v}$) 와 내적으로 곱해져있다는 차이점이 있다. 수학적으로 완성된 형태를 보고싶다면 다음의 과정을 따르면 된다. 

 

정의)  열린 영역 $U\subset\mathbb{R^n}$에서 정의된 점 $P$에서 미분가능한 함수 $f:U\to\mathbb{R}$에 대해$$Df(P):=\begin{pmatrix}D_1 f(P)& \cdots&D_n f(P)\end{pmatrix}$$  를 점 $P$에서 $f$의 미분계수라고 한다.

 

  동일한 성분을 가지는 기울기벡터는 열벡터이므로 다음의 관계식이 성립한다.

$$\nabla f(P)=\Bigl(D_1 f(P),\ldots,D_n f(P))\Bigr)=\begin{pmatrix}D_1 f(P)\\ \vdots\\D_n f(P)\end{pmatrix}$$

$$\therefore\Bigl(\nabla f(P)\Bigr)^T =Df(P)$$

  또한, 다음과 같이 벡터(항상 $n\times 1$ 열벡터로 인식하는!)의 내적은 전치행렬과 내적의 곱으로 바꿀 수 있다.

$$\vec{a}\cdot\vec{b}=(a_1,\ldots,a_n)\cdot(b_1,\ldots,b_n)=a_1 b_1+\cdots+a_n b_n$$

$$\vec{a}^T\vec{b}=\begin{pmatrix}a_1&\cdots&a_n\end{pmatrix}\begin{pmatrix}b_1\\ \vdots\\b_n\end{pmatrix}=a_1 b_1+\cdots+a_n b_n$$

$$\therefore\vec{a}\cdot\vec{b}=\vec{a}^T\vec{b}$$

  이러한 연산 특성을 이용하면 n차원 벡터 $\vec{v}$ 에 대해 다음과 같음을 알 수 있다.

$$\nabla f(P)\cdot\vec{v}=\Bigl(\nabla f(P)\Bigr)^T\vec{v}=Df(P)\vec{v}$$

  식 (2.2-6)을 아름답게 다시 기술하면 다음과 같다.

$$\forall P\in U\subset\mathbb{R^n},\quad\lim_{\vec{v}\to\vec{0}}\frac{f(P+\vec{v})-f(P)-Df(P)\vec{v}}{\left|\vec{v}\right|}=0\tag{2.2-7}$$

  식 (2.2-7)은 미분 가능한 다변수함수의 항등식을 의미한다. 수학적으로 잘 완성된 형태이나, 행벡터인 미분계수나 열벡터인 기울기벡터나 둘 다 많이 사용하는 형식이므로, 이렇게 표현할 수 있다는 것을 기억하고 다음으로 넘어가자.[footnote]미분 가능한 벡터장의 항등식에서 식 (2.2-7)을 다시 볼 기회가 있을 것이다.[/footnte]

 

  만약 함수 $f$ 가 미분 가능한 함수라는 것은 함수 $f$ 가 정의된 열린 집합 $U$ (정의역)의 모든 점 $P$ 에서 미분 가능하다는 것이다. 미분 가능한 함수 $f$ 에 대해 도함수를 다음과 같이 정의한다.

 

정의)  함수 $f$ 가 정의역 $U$ 의 모든 점에서 미분계수를 가지면 함수$$Df:U\to\mathbb{R},\;P\mapsto Df(P)$$  를 $f$ 의 도함수(derivative)라고 한다.

 


 

  다음의 정리를 얻는다.

 

정리 2.2-1)  열린집합 $U\subset\mathbb{R^n}$ 에서 정의된 함수 $f:U\to\mathbb{R}$ 이 점 $P\in U$ 에서 미분가능하면
  (ⅰ) $f$ 는 점 $P$ 에서 연속이다.
  (ⅱ) $f$ 는 점 $P$ 에서 모든 방향의 방향미분계수를 가지며, $D_{\vec{v}}f(P)=\nabla f(P)\cdot\vec{v}$ 이다.
  (ⅲ) 식 (2.1-2)를 만족시키는 벡터 $\vec{a}$ 는 $\nabla f(P)$ 이다.

 

  정리 2.2-1 (ⅲ)은 앞서 살펴본 바와 같이 알 수 있다. 정리 2.2-1 (ⅲ)의 유도 과정에서 식 (2.2-4)을 얻음으로써 정리 2.2-1 (ⅱ)도 알 수 있다. 정리 2.2-1 (ⅱ)은 기울기벡터를 안다면 매우 유용한 식이므로, 잘 기억해 두는 것이 좋다.

  정리 (ⅰ)은 다음과 같이 간단하게 알 수 있다.

 

proof)

  식 (2.1-2)와 동치인 식 (2.1-3)을 보면 분자의 함수가 small o notation의 정의에 따라 $o(\left|\vec{v}\right|)$ 임을 알 수 있다. 따라서 다음과 같다.

$$f(P+\vec{v})-f(P)-\vec{a}\cdot\vec{v}=o(\left|\vec{v}\right|)\iff f(P+\vec{v})=f(P)+\vec{a}\cdot\vec{v}+o(\left|\vec{v}\right|)\tag{2.2-8}$$

  함수 $f$ 가 점 $P$ 에서 연속이라는 것은 극한 $\lim_{\vec{v}\to \vec{0}}f(P+\vec{v})=f(P)$ 이 성립한다는 것을 의미한다. 이때, 식 (2.2-8)에 따라 다음과 같이 극한이 성립함을 알 수 있다.

$$\lim_{\vec{v}\to \vec{0}}f(P+\vec{v})=\lim_{\vec{v}\to \vec{0}}\left\{f(P)+\vec{a}\cdot\vec{v}+o(\left|\vec{v}\right|)\right\}=f(P)$$

  따라서 점 $P$ 에서 미분 가능한 함수 $f$ 는 점 $P$ 에서 연속임을 안다.   $\square$


다음 읽을거리: [미분의 정의부터 연쇄법칙까지] ch.3 벡터장


댓글