Aerospace Kim

[미분의 정의부터 연쇄법칙까지] ch.3 벡터장

이전 읽을거리:

[미분의 정의부터 연쇄법칙까지] ch.0 미분이란?

[미분의 정의부터 연쇄법칙까지] ch.1 일변수 미분

[미분의 정의부터 연쇄법칙까지] ch.2 다변수 미분


  본 포스팅은 PC chrome 환경에 최적화되어있습니다.

 

  본 포스팅에서는 미분의 의미부터 연쇄법칙의 유도까지 아주 상세하게 설명한다. 연쇄법칙의 원리를 아는 것의 가치는 태평양을 표류할 때의 나침반의 가치와 같다. 천천히, 꼼꼼하게 내용을 공부한다면, 연쇄법칙의 겉모양만 보고 기계적으로 연산하는 당신에게 커다란 통찰을 안겨줄 것이다. 이해가 안되거나 설명이 잘못되었다고 생각이 드는 부분이 있다면 얼마든지 댓글로 질문을 남겨주시기를 부탁드린다.

 

 

3. 벡터장 (vector field)

 

  주의: 3장에서 말하는 '다변수함수'란 정의역이 다차원이고 공역이 1차원인 함수만을 지칭한다. 벡터장도 정의역이 다차원이므로, 사실은 벡터장도 다변수함수이다. 하지만 서로 구분하기 위해 공역이 1차원인 함수를 다변수함수라고 하고, 공역이 다차원인 함수를 벡터장이라고 할 것이다.

 

  벡터장 $F:\mathbb{R^m\to R^n}$은 다음과 같이 쓴다.

$$F(X)=\Bigl(f_1(X),f_2(X),\ldots,f_n(X)\Bigr)$$

$$\mathrm{for}\;X=(x_1,\ldots,x_m),\quad f(x_1,\ldots,x_n)=\Bigl(f_1(x_1,\ldots,x_m),\ldots,f_n(x_1,\ldots,x_m)\Bigr)$$

  즉, m차원의 벡터를 받아 n차원의 벡터값이 나오는 함수가 벡터장인 것이다. (벡터장을 대문자로 쓰는 이유는, 관례상 1차원을 소문자로, 다차원을 대문자로 쓰기 때문이다)

 

  세상에서 제일 유명한 벡터장을 하나 꼽으라면, 나는 극좌표를 그 예시로 드리고 싶다. 극좌표가 왜 벡터장인지 처음 들으면 약간 의아할 수 있으나, 당연한 사실이다. 극좌표란 두 개의 실수 데이터 $r,\;\theta$를 받아 두 개의 실수 데이터 $x,\;y$를 출력하는 것이므로, 벡터장의 정의에 따르면 극좌표는 벡터장이 맞다. 직관적으로 설명하면, 다음 그림과 같은 것이다.

극좌표인 벡터장. (1.25,0.75π)를 받아 (0.9,-0.9)를 뱉는다.

  여기서 일반적인 표준직교좌표는 $(x,y)$이지만, 적어도 벡터장(함수) $P$에게는 $(r,\theta)$가 표준직교좌표이다. 따라서 함수마다 고유의 독립적인 표준직교좌표 공간을 갖는다고 생각할 수 있다.

 

  다음으로는 벡터장, 즉 벡터를 입력받아 벡터를 뱉는 함수 $F:\mathbb{R^m\to R^n}$의 도함수를 유도할 것이다. 이는 일변수함수나 다변수함수의 미분과는 달리 직관적으로 와닿지 않는 과정일 것이다. 그러나 그동안 여러가지 미분에 관련한 탐구를 첨예하게 해 놓은 덕분에, 다음의 과정은 그저 그동안 걸어온 길을 한번 더 걷는 기분일 것이다.

다음과 같이 정의하자.

 

정의)  열린 집합 $U\subset\mathbb{R^m}$에서 정의된 함수 $F:U\to\mathbb{R^n}$과 점 $P\in U$ 및 벡터 $\vec{v}$에 대하여, 다음의 극한값$$D_{\vec{v}}F(P):=\lim_{t\to 0}\frac{F(P+t\vec{v})-F(P)}{t}\iff\left.\frac{d}{dt}\right|_0F(P+t\vec{v})$$  가 존재하면 이 값을 점 $P$에서 $F$의 $\vec{\mathbf{v}}$-방향 순간변화율 이라고 한다.

 

  다변수함수와 마찬가지로, 이는 $\vec{\mathbf{v}}$-방향 미분계수 라고도 부른다. 여기서 다변수함수와 달리 결과값이 n차원임을 유의하자. 또한 다음과 같이 '벡터장 $F=(f_1,\ldots,f_n)$의 방향 미분계수의 각 성분'은 '각 성분함수의 방향 미분계수'이다.

$$\begin{align}D_{\vec{v}}F(P)&=\lim_{t\to 0}\frac{F(P+t\vec{v})-F(P)}{t}\\&=\lim_{t\to 0}\frac{\Bigl(f_1(P+t\vec{v}),\ldots,f_n(P+t\vec{v})\Bigr)-\Bigl(f_1(P),\ldots,f_n(P)\Bigr)}{t}\\&=\lim_{t\to 0}\left(\frac{f_1(P+t\vec{v})-f_1(P)}{t},\ldots,\frac{f_n(P+t\vec{v})-f_n(P)}{t}\right)\\&=\Bigl(D_{\vec{v}}f_1(P),\ldots,D_{\vec{v}}f_n(P)\Bigr)\end{align}$$

  다변수함수의 방향 순간변화율이 '이 벡터만큼 이동하면 값이 이만큼 변한다' 였다면, 벡터장의 방향 순간변화율은 '이 벡터만큼 이동하면 벡터값이 이만큼 변한다' 정도의 차이밖에 없다. 다음으로 넘어가자.

 

정의)  점 $P=(p_1,\ldots,p_n)\in U$에서 함수 $F:U\to\mathbb{R^n}$의 $\vec{e_k}$-방향 미분계수 $D_{\vec{e_k}}F(P)$를 단순히 $\mathbf{D}_{\mathbf{k}}\mathbf{F(P)}$로 쓰기로 하고, 이를 점 $P$에서 $F$의 $\mathbf{k}$번째 편미분계수 라고 정의한다.

 

  이 또한 마찬가지로, 다음과 같이 표기할 수 있다.

$$D_kF\iff\frac{\partial F}{\partial x_k}\iff\partial_{x_k}F$$

  벡터장의 편미분계수도 방향 미분계수와 같이 벡터값임을 유의하자.

 

  만약 함수 $f$가 편미분 가능한 함수라는 것은 함수 $f$가 정의된 열린 집합 $U$(정의역)의 모든 점 $p$에서 편미분 가능하다는 것이다.

 

정의)  함수 $F$가 정의역 $U$의 모든 점에서 $k$번째 편미분계수를 가지면 함수$$D_kF:U\to\mathbb{R^n},\;P\mapsto D_kF(P)$$  를 $F$의 $\mathbf{k}$번째 편도함수(partial derivative)라고 한다.

 

 

3.1. 미분 가능 함수 (벡터장)

 

  이미 일반화된 '함수의 미분가능성'을 '2.1. 미분 가능 함수 (다변수)'에서 정의하였다. 식 (2.1-1)에 따라, 미분 가능한 함수 $f$는 다음의 식을 만족하는 일차함수 $l$이 존재한다.

$$\lim_{X\to P}\frac{\left|F(X)-l(X)\right|}{\left|X-P\right|}=0$$

  여기서 벡터장 $F$에 대응하는 일차함수 $l$는 벡터장이어야 한다. 다행히, 일차함수의 정의와 정리 1.2-6으로부터 벡터장인 일차함수를 자연스럽게 안다. 위의 식으로부터 $F(P)=l(P)$임이 자명하다. 따라서 다음과 같다.

$$l(P)=l(P)+L(P-P)=l(P)=F(P)$$
$$\therefore l(X)=F(P)+L(X-P)=F(P)+A(X-P)$$

  여기서 행렬 $A$는 $n\times m$ 행렬이다. 미분 가능의 정의를 다시 쓰면,

$$\lim_{X\to P}\frac{\left|F(X)-F(P)-A(X-P)\right|}{\left|X-P\right|}=0\tag{3.1-1}$$

  미분 가능한 함수(벡터장) $F$는 위의 식을 만족시키는 행렬 $A$가 존재한다. 식 (3.1-1)에서 $X=P+\vec{v}$로 치환하면 다음과 같이 쓸 수도 있다.

$$\lim_{\vec{v}\to\vec{0}}\frac{\left|F(P+\vec{v})-F(P)-A\vec{v}\right|}{\left|\vec{v}\right|}=0\tag{3.1-2}$$

  식 (3.1-2)에서 행렬 $A$의 위치를 유심히 관찰하자. 행렬 $A$가 위치한 곳은 우리가 일변수함수와 다변수함수에서 미분계수가 위치하는 곳임을 익히 알고있다. 따라서 행렬 $A$가 무엇인지를 안다면 곧 벡터장의 미분계수가 무엇인지를 아는 것과 같다. 식 (3.1-2)을 다음과 같이 쓸 수 있다.

$$\lim_{\vec{v}\to\vec{0}}\frac{F(P+\vec{v})-F(P)}{\left|\vec{v}\right|}=\lim_{\vec{v}\to\vec{0}}\frac{A\vec{v}}{\left|\vec{v}\right|}\tag{3.1-3}$$

  벡터 $\vec{v}=t\vec{u}$와 같이 치환하자. $\vec{u}$는 임의의 고정된 벡터, $t$는 0으로 수렴하는 실수이다. 식 (3.1-3)의 우변은 다음과 같다.

$$\lim_{t\to 0}\frac{A(t\vec{u})}{\left|t\vec{u}\right|}=\lim_{t\to 0}\frac{tA\vec{u}}{t\left|\vec{u}\right|}=A\frac{\vec{u}}{\left|\vec{u}\right|}=\frac{1}{\left|\vec{u}\right|}(A\vec{u})\tag{3.1-4}$$

  식 (3.1-3)의 좌변은 다음과 같다.
$$\lim_{t\to 0}\frac{F(P+t\vec{u})-F(P)}{\left|t\vec{u}\right|}=\frac{1}{\left|\vec{u}\right|}\lim_{t\to 0}\frac{F(P+t\vec{u})-F(P)}{t}\tag{3.1-5}$$

  식 (2.2-3)은 벡터장 $f$를 성분으로 표기할 때, 그 의미가 보이기 시작한다. 식 (3.1-5)을 다음과 같이 쓸 수 있다.

$$\begin{align}&\frac{1}{\left|\vec{u}\right|}\lim_{t\to 0}\frac{\Bigl(f_1(P+t\vec{u}),\ldots,f_n(P+t\vec{u})\Bigr)-\Bigl(f_1(P),\ldots,f_n(P)\Bigr)}{t}\\=&\frac{1}{\left|\vec{u}\right|}\lim_{t\to 0}\frac{\Bigl(f_1(P+t\vec{u})-f_1(P),\ldots,f_n(P+t\vec{u})-f_n(P)\Bigr)}{t}\\=&\frac{1}{\left|\vec{u}\right|}\lim_{t\to 0}\left(\frac{f_1(P+t\vec{u})-f_1(P)}{t},\ldots,\frac{f_n(P+t\vec{u})-f_n(P)}{t}\right)\\=&\frac{1}{\left|\vec{u}\right|}\Bigl(D_{\vec{u}}f_1(P),\ldots,D_{\vec{u}}f_n(P)\Bigr)\tag{3.1-6}\end{align}$$

  여기서 식 (3.1-6)는 $k$번째 성분이 $D_{\vec{u}}f_k(P)$인 n차원 벡터(에 $\frac{1}{\left|\vec{u}\right|}$가 곱해진 것)임을 알 수 있다. 식 (3.1-4)와 함께 정리하면 다음과 같다.

$$\begin{pmatrix}D_{\vec{u}}f_1(P)\\ \vdots\\D_{\vec{u}}f_n(P)\end{pmatrix}=A\vec{u}\tag{3.1-7}$$

  행렬 $A$의 값을 구하기 위해서는 식 (1.2-2)의 행렬 연산 규칙을 참고하면 아주 쉽다. 행렬에 곱해지는 벡터가 표준단위벡터 $\vec{e_k}$라고 하자. 그리하면 $A\vec{e_k}$의 연산값은 행렬 $A$의 k번째 열벡터가 된다. 즉,

$$A\vec{e_k}=\begin{pmatrix}a_{1k}\\a_{2k}\\ \vdots\\a_{nk}\end{pmatrix}$$

  식 (3.1-7)의 좌변에도 $\vec{u}$에 $\vec{e_k}$를 대입하면 연산자 $D_{\vec{u}}=D_k$이므로, 다음과 같다.

$$\begin{pmatrix}D_kf_1(P)\\ \vdots\\D_kf_n(P)\end{pmatrix}=\begin{pmatrix}a_{1k}\\ \vdots\\a_{nk}\end{pmatrix}\tag{3.1-8}$$

  따라서 행렬 $A$는 다음과 같다.

$$A=\begin{pmatrix}D_1f_1(P)&D_2f_1(P)&\cdots&D_mf_1(P)\\D_1f_2(P)&D_2f_2(P)&&\\ \vdots&&\ddots&\vdots\\D_1f_n(P)&&\cdots&D_mf_n(P)\end{pmatrix}$$

 

  우리는 행렬 $A$가 벡터장 $F$의 점 $P$에서의 미분계수임을 알고있다. 다음과 같이 정의하며 벡터장의 미분계수 유도를 마친다.

 

정의)  열린 영역 $U\subset\mathbb{R^m}$에서 정의된 점 $P$에서 미분가능한 함수 $F:U\to\mathbb{R^n}$에 대해$$DF(P):=\begin{pmatrix}D_1f_1(P)&D_2f_1(P)&\cdots&D_mf_1(P)\\D_1f_2(P)&D_2f_2(P)&&\\ \vdots&&\ddots&\vdots\\D_1f_n(P)&&\cdots&D_mf_n(P)\end{pmatrix}$$  를 점 $P$에서 $F$의 미분계수라고 한다.

 

  벡터장의 미분계수를 편하게 외우는 방법은, 연산자 $D_k$를 마치 하나의 문자라고 생각하고 다음과 같은 연산을 하는 것이라고 생각하면 된다.

$$DF(P)=\begin{pmatrix}f_1(P)\\f_2(P)\\ \cdots\\f_n(P)\end{pmatrix}\begin{pmatrix}D_1&D_2&\cdots&D_m\end{pmatrix}$$

  물론, 정말로 위의 연산으로 미분계수가 도출되는 것이라 믿으면 곤란하다.

 

  벡터장의 편미분계수를 이용하여 미분계수를 편리하게 기술할 수 있다. 먼저, 벡터장 $F$의 k번째 편미분계수는 정의에 따라 다음과 같다.

$$D_kF=(D_kf_1,\ldots,D_kf_n)=\begin{pmatrix}D_kf_1\\ \vdots\\D_kf_n\end{pmatrix}$$

  따라서 미분계수를 다음과 같이 적을 수 있다.

$$\begin{align}DF&=\begin{bmatrix}\begin{pmatrix}D_1f_1\\D_1f_2\\ \vdots\\D_1f_n\end{pmatrix}&\begin{pmatrix}D_2f_1\\D_2f_2\\ \vdots\\D_2f_n\end{pmatrix}&\cdots&\begin{pmatrix}D_mf_1\\D_mf_2\\ \vdots\\D_mf_n\end{pmatrix}\end{bmatrix}\\&=\begin{pmatrix}D_1F&D_2F&\cdots&D_mF\end{pmatrix}\tag{3.1-9}\end{align}$$

  만약 함수 $F$가 미분 가능한 함수라는 것은 함수 $F$가 정의된 열린 집합 $U$(정의역)의 모든 점 $P$에서 미분 가능하다는 것이다. 미분 가능한 함수 $F$에 대해 도함수를 다음과 같이 정의한다.

 

정의)  함수 $F$가 정의역 $U$의 모든 점에서 미분계수를 가지면 함수$$DF:U\to\mathbb{R},\;P\mapsto DF(P)$$  를 $F$의 도함수(derivative)라고 한다.

 

  다음의 정리를 얻는다.

 

정리 3.1-1)  열린집합 $U\subset\mathbb{R^m}$에서 정의된 함수 $f:U\to\mathbb{R^n}$이 점 $P\in U$에서 미분가능하면
  (ⅰ) $F$는 점 $P$에서 연속이다.
  (ⅱ) $F$는 점 $P$에서 모든 방향의 방향미분계수를 가지며, $D_{\vec{v}}F(P)=DF(P)\vec{v}$ 이다.
  (ⅲ) 식 (3.1-1)를 만족시키는 행렬 $A$는 $DF(P)$ 이다.

 

  정리 3.1-1 (ⅲ)은 앞서 살펴본 바와 같이 알 수 있다. 정리 3.1-1 (ⅲ)의 유도 과정에서 식 (3.1-7)을 얻음으로써 정리 3.1-1 (ⅱ)도 알 수 있다. 정리 (ⅰ)은 다음과 같이 간단하게 알 수 있다.

 

proof)
  식 (3.1-1)과 동치인 식 (3.1-2)을 보면 분자의 함수가 small o notation의 정의에 따라 $o(\left|\vec{v}\right|)$임을 알 수 있다. 따라서 다음과 같다.
$$F(P+\vec{v})-F(P)-A\vec{v}=o(\left|\vec{v}\right|)\iff F(P+\vec{v})=F(P)+A\vec{v}+o(\left|\vec{v}\right|)\tag{3.1-10}$$
  함수 $F$가 점 $P$에서 연속이라는 것은 극한 $\lim_{\vec{v}\to \vec{0}}F(P+\vec{v})=F(P)$ 이 성립한다는 것을 의미한다. 이때, 식 (3.1-10)에 따라 다음과 같이 극한이 성립함을 알 수 있다.
$$\lim_{\vec{v}\to \vec{0}}F(P+\vec{v})=\lim_{\vec{v}\to \vec{0}}\left\{F(P)+A\vec{v}+o(\left|\vec{v}\right|)\right\}=f(P)$$
  따라서 점 $P$에서 미분 가능한 함수 $F$는 점 $P$에서 연속임을 안다.   $\square$


다음 읽을거리: [미분의 정의부터 연쇄법칙까지] ch.4 곡선


댓글