[미분의 정의부터 연쇄법칙까지] ch.1 일변수 미분
이전 읽을거리: [미분의 정의부터 연쇄법칙까지] ch.0 미분이란?
본 포스팅은 PC chrome 환경에 최적화되어있습니다.
본 포스팅에서는 미분의 의미부터 연쇄법칙의 유도까지 아주 상세하게 설명한다. 연쇄법칙의 원리를 아는 것의 가치는 태평양을 표류할 때의 나침반의 가치와 같다. 천천히, 꼼꼼하게 내용을 공부한다면, 연쇄법칙의 겉모양만 보고 기계적으로 연산하는 당신에게 커다란 통찰을 안겨줄 것이다. 이해가 안되거나 설명이 잘못되었다고 생각이 드는 부분이 있다면 얼마든지 댓글로 질문을 남겨주시기를 부탁드린다.
1. 일변수 미분
열린 집합 $U\subset\mathbb{R}$에서 정의된 함수 $f:U\to\mathbb{R}$ (즉, 1차원 값을 받아 1차원 값을 뱉는 함수 $f$) 에 대해 점 $p$에서의 미분계수는 다음과 같이 정의된다.
정의) 열린 집합 $U\subset\mathbb{R}$에서 정의된 함수 $f:U\to\mathbb{R}$의 점 $p$에서의 미분계수는 다음과 같이 정의된다.
$$f'(p):=\lim_{x\to p}\frac{f(x)-f(p)}{x-p}\iff\lim_{\Delta x\to 0}\frac{f(p+\Delta x)-f(p)}{\Delta x}\tag{1-1}$$
두 번째 식은 첫 번째 식의 $x$를 $p+\Delta x$로 치환하여 얻을 수 있는 식이다.
박테리아 증식 실험의 예시로 이해해보자. 한 측정시간 $p$와 다른 측정시간 $x$에 대하여 박테리아 수의 증가속도를 측정할 때, 시간 $p$의 순간적인 증가속도를 정확하게 측정하기 위해 다른 측정시간 $x$를 시간 $p$에 무한히 가깝게 하는 과정이 미분인 것이다. 즉, 미분이란 순간 변화율을 계산하는 행위이다.
함수 $f$의 점 $p$에서의 미분계수는 다음과 같이 여러 방법으로 표기할 수 있다.
$$f'(p)\quad\frac{df(p)}{dx}\quad\frac{df}{dx}(p)\quad Df(p)$$
수학은 형식에 얽매이지 않으므로, 용도에 알맞게 적절한 표기법을 택하면 된다.
만약 함수 $f$가 미분 가능한 함수라는 것은 함수 $f$가 정의된 열린 집합 $U$(정의역)의 모든 점 $p$에서 미분 가능하다는 것이다. 미분 가능한 함수 $f$에 대해 도함수를 다음과 같이 정의한다.
정의) 함수 $f$가 정의역 $U$의 모든 점에서 미분계수를 가지면 함수$$Df:U\to\mathbb{R},\;p\mapsto Df(p)$$ 를 $f$의 도함수(derivative)라고 한다.
아래는 모두 함수 $f$의 도함수를 의미하는 표기이다.
$$f'(x)\equiv\frac{df}{dx}\equiv\frac{d}{dx}f\equiv Df(x)$$
특히, 다음의 표기는 '함수 $f$를 미분하여 도함수를 구한 뒤 정의역의 어느 값 $p$를 대입한다' 라는 의미를 가진다.
$$\left.\frac{d}{dx}\right|_pf(x)\implies Df(p)$$
그러나 엄밀하게 '미분 가능'이 무엇인지 아직 살펴보지 않았다. 앞으로의 과정은 언제 미분 가능하다고 말하는지를 엄밀하게 정의한다.
1.1. 미분 가능 함수 (일변수)
정의) 열린 영역 $U\subset\mathbb{R}$에서 정의된 함수 $f:U\to\mathbb{R}$의 그래프가 점 $(p,f(p))$에서 접선을 가진다면 함수 $f$는 점 $p$에서 미분 가능하다고 한다.
일차원 함수 $f$의 그래프란 2차원 좌표평면의 곡선 $(x,f(x))\in\mathbb{R^2}$이다. 그리고 접선이란 점 $(p,f(p))$을 지나며, 함수 $f$의 그래프에 접하는 직선이다.
먼저 접선은 점 $(p,f(p))$을 지나므로, 직선의 방정식은 다음과 같다.
$$l(x):=f(p)+a(x-p)\tag{1.1-1}$$
이 직선이 $x=p$일때 $f(x)$와 '접한다'는 뜻은 점 $p$ 근방에서 $f(x)$와 $l(x)$의 차이가 0에 근접하는 속도가 $x$와 $p$의 차이가 0에 근접하는 속도보다 빠르다는 것을 의미한다. 수식으로 나타내면 다음과 같다.
$$\lim_{x\to p}\frac{\left| f(x)-l(x) \right|}{\left|x-p\right|}=\lim_{x\to p}\frac{\left| f(x)-f(p)-a(x-p) \right|}{\left|x-p\right|}=0\tag{1.1-2}$$
또는, $x=p+t$로 치환할 경우 다음과 같다.
$$\lim_{t\to 0}\frac{\left| f(p+t)-l(p+t) \right|}{\left|t\right|}=\lim_{t\to 0}\frac{\left| f(p+t)-f(p)-at \right|}{\left|t\right|}=0$$
즉, 위의 식을 만족시키는 상수 $a$(접선의 기울기)가 존재한다면 함수 $f$는 점 $p$에서 미분 가능하다는 것이다. 추가적으로, 위의 식을 정리하면 접선의 기울기 $a$는 다음과 같이 결정됨을 알 수 있다.
$$\begin{align}& \lim_{t\to 0}\frac{\left| f(p+t)-f(p)-at \right|}{\left|t\right|}=0\iff\lim_{t\to 0}\frac{f(p+t)-f(p)-at}{t}=0\tag{1.1-3}\\ \iff& \lim_{t\to 0}\left(\frac{f(p+t)-f(p)}{t}-a\right)=0\iff a=f'(p)\end{align}$$
따라서 접선의 기울기는 $f'(p)$로, 직선 함수는 $l(x)=f(p)+f'(p)(x-p)$임을 알 수 있다. 이러한 수식을 토대로 다음의 정리를 이끌어낼 수 있다.
정리 1.1-1) 열린 집합 $U\subset\mathbb{R}$에서 정의된 함수 $f:U\to\mathbb{R}$가 점 $p\in U$에서 미분 가능하면
(ⅰ) $f$는 점 $p$에서 연속이다.
(ⅱ) 식 (1.1-2)를 만족시키는 상수 $a$는 $f'(p)$이다.
정리 1.1-1 (ⅱ)는 앞서 살펴본 바와 같이 알 수 있다. 정리 1.1-1 (ⅰ)은 아래와 같이 간단하게 증명된다.
proof)
먼저, small o notation을 다음과 같이 정의한다.
$$o(t):=\left\{f:\mathbb{R\to R^n}\;\left|\;\lim_{t\to 0}\frac{\left|f(t)\right|}{t}=0\right.\right\}$$
즉, $x$보다 0에 감소하는 속도가 빠른 모든 함수(공역이 n차원인 함수도 포함하여)를 일컬어 $o(x)$라고 표기하는 것이다. 직관적인 예시로는 $t^2$가 있다.
지금은 공역이 1차원인 경우에만 관심이 있다. Small o notation의 정의로부터, 다음이 자명하다.
$$\lim_{t\to 0}o(t)=0$$
증명으로 돌아와서, 식 (1.1-2)와 동치인 식 (1.1-3)을 보면 분자의 함수가 정의에 따라 $o(t)$임을 알 수 있다. 따라서 다음과 같다.
$$f(p+t)-f(p)-at=o(t)\iff f(p+t)=f(p)+at+o(t)\tag{1.1-4}$$
함수 $f$가 점 $p$에서 연속이라는 것은 극한 $\lim_{x\to 0}f(p+x)=f(p)$ 이 성립한다는 것을 의미한다. 이때, 식 (1.1-4)에 따라 다음과 같이 극한이 성립함을 알 수 있다.
$$\lim_{x\to 0}f(p+x)=\lim_{x\to 0}\left\{f(p)+ax+o(x)\right\}=f(p)$$
따라서 점 $p$에서 미분 가능한 함수 $f$는 점 $p$에서 연속임을 안다. $\square$
여기서 잠시, 우리는 직선이 무엇인지 정의하지 않고도 식 (1.1-1)와 같이 직선 함수를 알고 있었다. 1차원 함수의, 또는 2차원 그래프의 선형 근사 함수인 직선의 특성을 확인해보자. 이 과정은 선형 근사 함수를 재정의하는데 도움이 된다.
1.2. 일차함수
정리 1.2-1) 집합 $U\subset\mathbb{R}$에서 정의된 직선 함수 $l:U\to\mathbb{R}$은 다음의 성질을 만족한다.
직선 함수의 정의역의 임의의 점 $q\in U$와 임의의 실수 $x\in\mathbb{R}$에 대하여, 새로운 함수를 다음과 같이 정의하자.$$L(x):=l(q+x)-l(q)$$ 이때, 함수 $L(x)$는 선형적이다. 즉, 다음의 두 특성을 만족한다.
(ⅰ) 임의의 실수 $t$에 대해, $L(tx)=tL(x)$ 가 성립한다.
(ⅱ) 임의의 실수 $y$에 대해, $L(x+y)=L(x)+L(y)$ 가 성립한다.
proof)
미리 알고 있듯이, 어떤 점 $(p,l(p))$을 지나는 그래프로 표현되는 직선 함수는 식 (1.1-1)와 같이 다음과 같다.
$$l(x)=l(p)+a(x-p)$$
따라서 새로 정의된 함수 $L(x)$는 다음과 같다.
$$\begin{align} l(q+x)&=l(p)+a((q+x)-p)=l(p)+a(x+q-p)\\l(q)&=l(p)+a(q-p)\end{align}$$
$$\begin{align} \therefore L(x)&=l(q+x)-l(q)\\&=\left\{l(p)+a(x+q-p)\right\}-\left\{l(p)+a(q-p)\right\}\\&=ax\end{align}$$
(ⅰ) : $L(tx)=a(tx)=atx=tax=t(ax)=tL(x)$
(ⅱ) : $L(x+y)=a(x+y)=ax+ay=L(x)+L(y)$
따라서 함수 $L(x)=l(q+x)-l(q)$는 선형적이다. $\square$
직선은 (2차원 '그래프'로 표현되는) 1차원 함수뿐 아니라, 고차원에서도 직선이라고 부를 수 있는 것을 정의할 수 있다. 만약 고등학교 수학교육과정을 이수한 사람은, 3차원에서 평면의 방정식이 다음과 같이 주어짐을 알 것이다.
$$ax+by+cz+d=0$$
이는 3차원 공간에서 '그래프'로 표현되는 평면이자, 2차원 함수 $z=\frac{a}{c}x+\frac{b}{c}y+\frac{d}{c}$ 로도 볼 수 있다.
잠시, 2차원 좌표평면에서 '그래프'로 표현되는 직선 $ax+by+c=0$이 1차원 함수 $y=\frac{a}{b}x+\frac{c}{b}$ 로도 표현되었던 것을 상기해 보자. 약간의 통찰을 더하면, 다음과 같은 사실을 알 수 있다.
정리 1.2-2) 집합 $U\subset\mathbb{R^2}$에서 정의된 평면 함수 $l:U\to\mathbb{R}$은 다음의 성질을 만족한다.
평면 함수의 정의역의 임의의 점 $\vec{q}:=(q_1,q_2)\in U$와 임의의 벡터 $\vec{x}:=(x,y)\in\mathbb{R^2}$에 대하여, 새로운 함수를 다음과 같이 정의하자.$$L(\vec{x}):=l(\vec{q}+\vec{x})-l(\vec{q})$$ 이때, 함수 $L(\vec{x})$는 선형적이다. 즉, 다음의 두 특성을 만족한다.
(ⅰ) 임의의 실수 $t$에 대해, $L(t\vec{x})=tL(\vec{x})$ 가 성립한다.
(ⅱ) 임의의 벡터 $\vec{y}$에 대해, $L(\vec{x}+\vec{y})=L(\vec{x})+L(\vec{y})$ 가 성립한다.
proof)
위에서 언급한 바와 같이, $ax+by+cz+d=0$로 표현되는 3차원 평면은 다음의 2차원 평면함수와 동치이다.
$$l(x,y)=z=ax+by+c$$
여기서 새로운 벡터 $\vec{a}:=(a,b)$에 대해 다음과 같이 다시 쓸 수 있다.
$$l(\vec{x})=\vec{a}\cdot\vec{x}+c$$
따라서 새로 정의된 함수 $L(\vec{x})$는 다음과 같다.
$$\begin{align}l(\vec{q}+\vec{x})&=\vec{a}\cdot(\vec{q}+\vec{x})+c\\l(\vec{q})&=\vec{a}\cdot\vec{q}+c\end{align}$$
$$\begin{align} \therefore L(\vec{x})&=l(\vec{q}+\vec{x})-l(\vec{q})\\&=\left\{\vec{a}\cdot(\vec{q}+\vec{x})+c\right\}-\left\{\vec{a}\cdot\vec{q}+c\right\}\\&=\vec{a}\cdot\vec{x}\end{align}$$
(ⅰ) : $L(t\vec{x})=\vec{a}\cdot(t\vec{x})=t\vec{a}\cdot\vec{x}=t(\vec{a}\cdot\vec{x})=tL(\vec{x})$
(ⅱ) : $L(\vec{x}+\vec{y})=\vec{a}\cdot(\vec{x}+\vec{y})=\vec{a}\cdot\vec{x}+\vec{a}\cdot\vec{y}=L(\vec{x})+L(\vec{y})$
따라서 함수 $L(\vec{x})=l(\vec{q}+\vec{x})-l(\vec{q})$는 선형적이다. $\square$
지금까지 $\mathbb{R}$에서 정의된 직선함수, $\mathbb{R^2}$에서 정의된 평면함수가 동시에 만족하는 특성에 대해 알아보았다. 또한 기하적으로도, 직선과 평면은 은근히 닮은 구석이 있다. 따라서 위와 같은 특성을 만족하는 함수를 앞으로 일차함수라고 부르기로 하자. (주의: 일차함수의 표준적인 정의가 아닐 수도 있다)
일차함수가 1차원과 2차원에서 정의될 수 있다면, 직관적이진 않지만 3차원 이상에서도 정의될 수 있을 것이라 짐작할 수 있다. 이것이 바로 직선 함수와 평면 함수를 일차함수라는 용어로 정리한 이유이며, n차원에서 정의되는 일차함수는 다음의 정리를 만족할 것이라 기대할 수 있다.
정리 1.2-3) 집합 $U\subset\mathbb{R^n}$에서 정의된 일차함수 $l:U\to\mathbb{R}$은 다음의 성질을 만족한다.
일차함수의 정의역의 임의의 점 $\vec{q}:=(q_1,\ldots,q_n)\in U$와 임의의 벡터 $\vec{x}:=(x_1,\ldots,x_n)\in\mathbb{R^n}$에 대하여, 새로운 함수를 다음과 같이 정의하자.$$L(\vec{x}):=l(\vec{q}+\vec{x})-l(\vec{q})$$ 이때, 함수 $L(\vec{x})$는 선형적이다. 즉, 다음의 두 특성을 만족한다.
(ⅰ) 임의의 실수 $t$에 대해, $L(t\vec{x})=tL(\vec{x})$ 가 성립한다.
(ⅱ) 임의의 벡터 $\vec{y}$에 대해, $L(\vec{x}+\vec{y})=L(\vec{x})+L(\vec{y})$ 가 성립한다.
위의 정리에서 식 $L(\vec{x}):=l(\vec{q}+\vec{x})-l(\vec{q})$ 부분은 $\vec{y}=\vec{q}+\vec{x}$ 와 같이 치환하여 동치인 식 $L(\vec{x}-\vec{q}):=l(\vec{x})-l(\vec{q})$ 을 얻을 수 있다. (아래의 정의에서 똑같이 나타날 것이다)
지금부터는 코페르니쿠스적 전환의 시간이다. 일차함수를 다음과 같이 정의하자.
정의) 어떤 함수 $l:\mathbb{R^m\to R^n}$에 대하여$$l(X)=l(P)+L(X-P)\quad\left(X,P\in\mathbb{R^m}\right)$$ 을 만족하는 선형 사상 $L$이 존재한다면 함수 $l$을 일차함수라고 한다.
이러한 정의 방식은 마치,
"운동을 하면 땀이 나고 잠시 힘들지만 자고 일어나면 더 힘이 난다. 그러므로 땀이 나며 잠시 힘들지만 자고 일어나면 더 힘이 나는 것을 운동이라고 하자!"
라고 하는 것과 같다. 즉, 어떤 것의 성질을 찾고 그 성질이 본질임을 알면 그것으로부터 정의를 거꾸로 이끌어낼 수 있는 것이다. 이런 방식은 수학을 할 때 여러모로 쓸모가 있다.
선형 사상이란 다음의 두 성질을 만족하는 모든 함수의 집합이다.
$$\begin{align} (\mathrm{i})&\quad\forall t\in\mathbb{R},\;L(tX)=tL(X)\\(\mathrm{ii})&\quad L(X+Y)=L(X)+L(Y)\end{align}$$
선형 사상이 무엇인지 엄밀하게 공부하려면 선형대수학을 (조금이지만)공부해야하는 수고로움이 따른다. 그 대신에 선형사상이 실제로 무슨 함수로 나타나는지만 간단하게 알아보자.
정리 1.2-4) 선형사상 $L(x):\mathbb{R\to R}$ 은 어떤 실수 $a\in\mathbb{R}$에 대해 다음과 같다.
$$L(x)=ax$$
proof)
점 $1$에서 선형 사상의 상(함수값)을 어떤 값 a, 다시말해 $L(1)=a$ 이라고 하자. 선형사상의 성질에 따라 다음이 성립한다.
$$L(x)=L(x\cdot 1)=xL(1)=xa=ax$$
따라서 어떤 선형사상 $L(x)$가 $ax$이게 하는 어떤 $a$가 존재함을 안다. $\square$
정리 1.2-5) 선형사상 $L(\vec{x}):\mathbb{R^n\to R}$ 은 어떤 벡터 $\vec{a}\in\mathbb{R^n}$에 대해 다음과 같다.$$L(\vec{x})=\vec{a}\cdot\vec{x}$$
proof)
표준단위 벡터 $\vec{e_i}\in\mathbb{R^n}$ ($i$번째 성분만 1이고 나머지가 0인 n차원 벡터)의 상이 어떤 값 $a_i$ , 다시말해 $L(\vec{e_i})=a_i$ 이라고 하자. 벡터 $\vec{a}$를 다음과 같이 정의하자.
$$\vec{a}:=(a_1,\ldots,a_n)\in\mathbb{R^n}$$
선형 사상의 성질에 따라 다음이 성립한다.
$$\begin{align} L(\vec{x})&=L(x_1,\ldots,x_n)=L(x_1\vec{e_1}+\cdots+x_n\vec{e_n})\\&=L(x_1\vec{e_1})+\cdots+L(x_n\vec{e_n})\\&=x_1L(\vec{e_1})+\cdots+x_nL(\vec{e_n})\\&=x_1a_1+\cdots+x_na_n\\&=\vec{a}\cdot\vec{x}\tag*{$\square$}\end{align}$$
따라서 어떤 선형 사상 $L(\vec{x})$가 $\vec{a}\cdot\vec{x}$이게 하는 어떤 $\vec{a}$가 존재함을 안다. $\square$
정리 1.2-6) 선형사상 $L(\vec{x}):\mathbb{R^m\to R^n}$ 은 어떤 $n\times m$행렬 $A$에 대해 다음과 같다.$$L(\vec{x})=A\vec{x}$$
proof)
표준단위 벡터 $\vec{e_i}\in\mathbb{R^m}$의 상이 어떤 벡터 $\vec{a_i}\in\mathbb{R^n}$ , 다시말해 $L(\vec{e_i})=\vec{a_i}$ 이라고 하자. 여기서 벡터 $\vec{a_i}$는 선형사상의 상으로서 n차원이며, 그 성분의 하첨자를 다음과 같이 정의하자.
$$\vec{a_i}:=(a_{1i},a_{2i},\ldots,a_{ni})=\begin{pmatrix}a_{1i}\\ a_{2i}\\ \vdots \\ a_{ni}\end{pmatrix}$$
위의 식처럼 쓸 수 있는 이유는, 수학에서 n차원 벡터는 $n\times 1$ 행렬, 즉 열벡터로 여겨지기 때문이다. 선형 사상의 성질에 따라 다음이 성립한다.
$$\begin{align}L(\vec{x})&=L(x_1,\ldots,x_n)=L(x_1\vec{e_1}+\cdots+x_n\vec{e_n})\\&=L(x_1\vec{e_1})+\cdots+L(x_n\vec{e_n})\\&=x_1L(\vec{e_1})+\cdots+x_nL(\vec{e_n})\\&=x_1\vec{a_1}+\cdots+x_n\vec{a_n}\tag{1.2-1}\end{align}$$
$n\times m$행렬 $A$는 다음과 같이 $a_i$를 $i$번째 열벡터로 갖는 행렬이라고 하자.
$$A:=\begin{pmatrix}\vec{a_1}&\cdots&\vec{a_n}\end{pmatrix}=\begin{pmatrix}a_{11} & a_{12} & \cdots & a_{1m} \\ a_{21} &&& \\ \vdots && \ddots & \vdots \\ a_{n1} && \cdots & a_{nm}\end{pmatrix}$$
행렬 $A$에 열벡터 $\vec{x}$를 곱하는 연산 $A\vec{x}$을 시행하면 다음과 같다.
$$\begin{align}A\vec{x}&=\begin{pmatrix}a_{11} & a_{12} & \cdots & a_{1m} \\ a_{21} &&& \\ \vdots && \ddots & \vdots \\ a_{n1} && \cdots & a_{nm}\end{pmatrix}\begin{pmatrix}x_1\\ \vdots \\ x_m\end{pmatrix}=\begin{pmatrix}x_1 a_{11}+x_2 a_{12}+\cdots+x_m a_{1m}\\x_1 a_{21}+x_2 a_{22}+\cdots+x_m a_{2m}\\ \vdots \\ x_1 a_{n1}+x_2 a_{n2}+\cdots+x_m a_{nm}\end{pmatrix}\\&=\begin{pmatrix}x_1 a_{11}\\x_1 a_{21} \\ \vdots \\ x_1 a_{n1}\end{pmatrix}+\begin{pmatrix}x_2 a_{12}\\x_2 a_{22} \\ \vdots \\ x_2 a_{n2}\end{pmatrix}+\cdots+\begin{pmatrix}x_m a_{1m}\\x_m a_{2m} \\ \vdots \\ x_m a_{nm}\end{pmatrix}\\&=x_1\begin{pmatrix}a_{11}\\a_{21} \\ \vdots \\a_{n1}\end{pmatrix}+x_2\begin{pmatrix}a_{12}\\a_{22} \\ \vdots \\a_{n2}\end{pmatrix}+\cdots+x_m\begin{pmatrix}a_{1m}\\a_{2m} \\ \vdots \\a_{nm}\end{pmatrix}\\&=x_1\vec{a_1}+x_2\vec{a_2}+\cdots+x_n\vec{a_n}\tag{1.2-2}\end{align}$$
식 (1.2-1)과 식 (1.2-2)가 서로 같으므로, 어떤 선형사상 $L(\vec{x})$가 $A\vec{x}$이게 하는 어떤 $A$가 존재함을 안다. $\square$
추가적으로, 정리 1.2-5는 정리 1.2-6의 특수한 경우(선형사상의 공역이 $\mathbb{R^n=R}$, 즉 $n=1$)이므로 다음과 같이 생각할 수도 있다.
따름정리 1.2-7) 선형사상 $L(\vec{x}):\mathbb{R^n\to R}$ 은 어떤 벡터 $\vec{a}\in\mathbb{R^n}$에 대해 다음과 같다.$$L(\vec{x})=\vec{a}^T\vec{x}$$
proof)
정리 1.2-6에서 $n=1$인 경우는 행렬 $A$가 $1\times m$인 경우, 즉 행렬 $A$가 m차원의 행벡터인 경우이다. m차원 행벡터를 다음과 같이 정의하자.
$$A=\begin{pmatrix}a_1&\cdots&a_m\end{pmatrix}$$
$$\therefore L(\vec{x})=A\vec{x}=\begin{pmatrix}a_1&\cdots&a_m\end{pmatrix}\begin{pmatrix}x_1\\ \vdots \\ x_m\end{pmatrix}=a_1 x_1 + \cdots + a_m x_m$$
이는 정리 1.2-5의 결과와 일치한다. 벡터 $\vec{a}$를 다음과 같이 정의하자.
$$\begin{align}&\vec{a}:=(a_1,\ldots,a_m)=\begin{pmatrix}a_1\\\vdots\\a_m\end{pmatrix}\\ \iff & \vec{a}^T=\begin{pmatrix}a_1\\ \vdots\\a_m\end{pmatrix}^T=\begin{pmatrix}a_1&\cdots&a_m\end{pmatrix}=A\end{align}$$
위의 식에서 상첨자 $^T$는 행렬의 전치(transpose)를 의미한다.
정리 1.2-6에서 행렬 $A$ 에 행벡터 $\vec{a}^T$를 대입하면 원하는 결과를 얻는다. $\square$
따름정리 1.2-7은 선형대수를 조금이라도 공부한 사람에게는 정리 1.2-5로부터 자연스럽게 도출되는 결과이다. 하지만 정리 1.2-6이 정리 1.2-5와 정리 1.2-4를 포함하는 개념임을 강조하기 위해 서술하였다.
다음 읽을거리: [미분의 정의부터 연쇄법칙까지] ch.2 다변수 미분
'수학 > 미적분학' 카테고리의 다른 글
[미분의 정의부터 연쇄법칙까지] ch.5 미분 연산자의 성질 (0) | 2021.04.06 |
---|---|
[미분의 정의부터 연쇄법칙까지] ch.4 곡선 (0) | 2021.04.06 |
[미분의 정의부터 연쇄법칙까지] ch.3 벡터장 (0) | 2021.04.06 |
[미분의 정의부터 연쇄법칙까지] ch.2 다변수 미분 (0) | 2021.04.06 |
[미분의 정의부터 연쇄법칙까지] ch.0 미분이란? (0) | 2021.04.06 |
댓글