수학

미분이라는 용어의 문제점 dy/dx는 분수인가?

2367 2025. 4. 21. 09:16

 

 

현재 사용되는 미분이라는 용어에는 문제점이 있습니다.

이 글에서는 미분이라는 용어에서의 문제점을 짚으면서 용어의 역사적인 맥락과 같이 정확한 의미에 대해서 정리해 보도록 하겠습니다.

 

미분이라는 용어에는 번역어로서의 문제가 있습니다

미분이라는 한자어는 differentiation에 대응하는 번역어로 쓰이면서 동시에 differential이라는 용어의 번역에도 동시에 쓰이고 있습니다.

또한 derivative에 번역으로서 미분이라는 용어가 사용되는 경우도 있어 영어권에서는 서로 다른 개념으로 생각하는 3가지 개념이 미분이라는 하나의 용어로 혼재되어 설명되고 있습니다.

따라서 이러한 개념을 정확하게 구분해 주는 작업이 필요하며 이를 위해 원용어 의미를 하나씩 설명하겠습니다.

 

Differentiation

미분이라는 용어가 가장 많이 의미하고 있는 개념입니다.

가령 '이 함수를 미분해봐'라고하는 표현에서의 미분이 의미하는 것이 differentiation입니다.

이는 differentiate라는 동사의 명사형이며 differentiate는 derivative를 구하는것을 의미하는 동사입니다.

 

Derivative

Derivative는 현재 미분이론에 있어서 가장 기본적으로 사용하는 도구입니다.

일반적으로 도함수로서 번역되나 원단어의 용례를 살펴보면 도함수라는 단어와는 달리 함수라는 개념을 무조건 강조하는 단어는 아닙니다.

함수 \(f:\mathbb{R}\to\mathbb{R}\) 에 대한 각 \(x\)점에서의 Derivative는

$$f'(x) = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h}$$

의 수식으로 정의되는 \(x\)마다의 값을 뜻하는 용어로, '각 점 \(x\)에서의 derivative를 생각할 수 있기 때문에 derivative를 함수로도 생각할 수 있다 (derivative as a function)' 등의 형식으로 함수로 확장하며 설명될 때가 있습니다.

그렇기 때문에 간혹 derivative function이라는 용례도 보이며 이러한 경우를 생각하면 함수의 개념을 너무 많이 강조하는 도함수라는 단어와는 어감의 차이가 있습니다.

또한 derivative를 미분이라 번역하는 경우도 보이는데 이는 특히 다변수함수에서 partial derivative, total derivative 등의 원어를 편미분전미분으로서 번역하며 자주 일어나는것 같습니다.

 

순간변화율?

현재 고등학교 과정에서 순간변화율이라는 용어를 주요 수학적 용어로서 derivative의 개념에 대한 정의로 사용하는데 이 또한 영어권에서의 용어사용과 차이가 있는 부분입니다.

영어권에서 또한 순간변화율이라는 개념을 사용하지만 이는 순간변화율이라는 용어에 자체적인 수학적 정의를 내린다기보다는 derivative를 순수하게 수학적 수식형태로 정의하고 난 뒤에 이러한 derivative를 해석하기 위한 설명으로서 순간변화율이라는 개념이 쓰이게 됩니다.

따라서 영어권에서는 순간변화율이라는 용어 자체의 중요성은 결코 크지 않습니다.

가령 다변수함수에서 또한 derivative는 기본적인 수학적 도구로서 사용하게 되지만, 이때 다변수함수의 derivative를 단순한 순간변화율로서 해석하기는 힘들어지게 됩니다.

이러한 점을 고려하면 영어권에서의 용어사용이 좀 더 설득력을 갖고 있다고 볼 수 있습니다.

 

결국 derivative는 무엇인가

그렇다면 derivative라는 개념에 대한 정의의 동기(motivation)는 무엇일까요?

Derivative라는 용어와 정의는 단순히 그 수식적인 정의만 보아서는 (특히 다변수의 경우) 왜 이러한 정의로 이 용어가 사용되는지 직관적으로 완전히 이해하기 어렵습니다.

이는 미적분학의 발전과정과도 관련이 있는 문제로서 derivative라는 개념의 사용의 의의를 정확하게 이해하기 위해서는 미적분학의 역사적인 이해가 필요하게 되고 이는 결국 differential에 대한 이해를 필요로 합니다.

 

Differential

비영어권 사람들이 이 용어를 처음 접했을 때 흔히 할 수 있는 착각이 differential이 differentiate의 형용사형이라고 생각하게 되는 것입니다.

Differential은 differentiate의 파생형용사가 아니며 오히려 역사적으로서는 가장 핵심적으로 사용되었던 어떠한 수학적 객체를 가리키는 명사입니다.

Calculus는 원래 differential calculus로 이러한 differential이라는 수학적 객체를 계산하는 방법이라는 뜻이며 미분방정식 differential equation, 미분기하학 differential geometry 등의 분야전체를 말할 때 쓰는 용어에서의 differential 또한 형용사형으로 쓰이는 것이 아니라 differential이라는 수학적 객체를 의미하는 것입니다.

이러한 differential의 번역으로서 미분이 쓰이는데 간혹 좀 더 명확한 구분을 주기 위해 미분소, 미분조각이라 번역하는 경우도 있습니다.

 

라이프니츠의 미분

라이프니츠가 미분을 발명했다는것은 잘 알려진 이야기입니다.

그런데 이때의 라이프니츠의 미분이라는 것이 바로 differential입니다.

라이프니츠의 목적은 곡선을 연구하는 것이었고 이때 곡선을 무한히 작은 변화의 관점에서 보면 곡선을 직선에 근사해서 연구할 수 있게 됩니다.

따라서 이러한 무한히 작은 변화라는 개념자체를 연구할 필요가 있었고 그것에 differential이라고 이름을 붙여주었습니다.

즉 변수 \(x\)의 유한한 변화량을 \(\Delta x\)라고 했을 때 무한히 작은 변화량을 \( \mathrm {d} x\)라고 표기했고 이러한 \(\mathrm{d}x\)를 differential이라고 불렀습니다.

이때에 무한히 작다란 것을 따로 무한소 infinitesimal라고 부르며 설명하기도 했습니다.

이러한 differential의 개념은 굉장히 모호했는데, 가령 \(xy\)에 대한 differential을 계산하는 설명은 다음과 같았습니다.

 

변수의 변화량이라는 정의에 의해

$$ \mathrm{d}(xy)=(x+\mathrm{d}x)(y+ \mathrm{d}y)-xy $$

$$ =x \mathrm{d}y+y \mathrm{d}x+ \mathrm{d}x \mathrm{d}y $$

이라고 계산할 수 있게 되는데 이때 \( \mathrm{d} x \mathrm{d} y\)는 \( \mathrm{d} x\)와 \( \mathrm{d} y\)에 비해 굉장히 작은 수이므로 없어지게 되고 따라서

$$ \mathrm{d}(xy)=x \mathrm{d}y+y \mathrm{d}x $$

 

여기서 '상대적으로 작으므로 없어지게 된다'라는 설명은 굉장히 임의적입니다.

하지만 결과자체는 체계화된 현대수학 관점에서도 합당하다는 것을 보면 어떤 굉장한 직관이 있었음은 확실합니다.

또 결국 그러한 직관을 당시 수학자들에게 인정을 받아서 오일러의 시대를 거쳐 코시의 시대가 오기 전까지 미적분학은 이러한 모호한 differential이란 도구의 기반 위에서 150년간 많은 발전을 이루어 내게 됩니다.

 

많은 결과를 만들어 냈던 미적분학과 그 근간인 differential이지만 어쨌든 간에 무한소로서 설명되는 differential이라는 개념자체가 문제가 있었던 건 사실입니다.

많은 비판이 있었고 당시 버클리는 무한소라는 개념에 대해 '사라진 양의 유령'이라 부르며 '수학자들은 원리에 의해서 결론을 증명하지 않고 결론에 의해서 원리를 옹호하다'라고 했습니다.

결국 한시라도 빨리 미적분학을 논리적으로 안정된 토대에 올리는 게 중요해졌습니다.

 

코시의 미분

이러한 작업은 라이프니츠 시대로부터 거의 150년이 지난 코시 시대에 이르러서 진행되게 되었습니다.

코시는(엄밀히 말해 코시 한 사람이 시작해서 완성시킨 업적은 아니지만 코시가 이러한 작업을 대표하는 수학자임은 확실합니다) 이러한 differential의 개념을 derivative의 개념으로 변환시켰습니다.

현재 고등학교에서 자세하게 가르치지는 않지만 극한의 개념은 수학적으로 엄밀하게 정의할 수 있는 개념입니다.

이러한 극한의 개념을 다지고 극한의 개념으로서 derivative를 정의했기 때문에 따라서 derivative는 기존의 differential과는 달리 엄밀한 논증을 할 수 있는 도구로서 역할을 하게 됩니다.

 

우선 코시는 derivative를 극한을 이용해서 정의하고 기존에 사용하던 differential을 derivative로서 표현할 수 있도록 differential을 다음과 같이 정의합니다.

 

고정된 상수 \(h\)에 대해

$$ \lim_{\alpha \to 0} \frac{f(x+\alpha h)-f(x)}{\alpha}\ $$

를 함수 \(y=f(x)\) 의 differential이라고 정의를 하고 \( \mathrm{d} y\)라고 했는데 이는 \( \mathrm{d} y=f'(x)h\) 로서 쓸 수 있게 됩니다.

또한 \(f(x)=x\)의 항등함수의 경우로서 \( \mathrm{d} x\)를 생각하면 \( \mathrm{d} x=1*h=h\)가되어서 최종적으로 \( \mathrm{d} y=f'(x) \mathrm{d} x\) 라고 쓸 수 있게 됩니다.

 

이러한 코시의 정의를 정리하여 다시 적어보면

 

한 점 \(a\)에서의 differential \(\mathrm{d}y\)는 \(h\)에 관한 함수로서(아주 정확히는 \(h\)와 \(a\)에 대한 이변수 함수)

$$ \mathrm{d}y(h)=f'(a)h $$

로 정의되고, 마찬가지로 항등함수 \(x\)에 대해 \(\mathrm{d}x(h)=h\) 이므로

$$ \mathrm{d}y(h)=f'(a)h=f'(a)\mathrm{d}x(h) $$

 

이러한 derivative에 기반한 differential의 새로운 정의에 의해 코시 이전의 모호했던 differential을 기반으로 발전되왔던 결과물들이 derivative의 개념으로 변환되어 해석할 수 있게 되었고, 이로서 미분은 안정적인 기반위에 놓이게 되었습니다.

 

그래서 \(\frac{ \mathrm{d} y}{ \mathrm{d} x}\)는 분수인가?

그래서 \(\frac{ \mathrm{d} y}{ \mathrm{d} x}\)는 분수일까요?

네. 이는 differential(미분)이라는 두 대상의 분수형태(즉 미분몫)입니다.

하지만 결국 우리가 근본적인 체계를 세워 툴로서 다루고 있고 관심이 있는 대상은 differential이 아닌 derivative이기 때문에 이것을 굳이 differential의 개념으로서 분수로 보는 것은 (대부분의 경우에 있어서) 의미가 없는 일입니다.

따라서 \(\frac{ \mathrm{d} y}{ \mathrm{d} x}\)라는 표기는 이를 단순히 \(f'(x)\)의 다른 표현으로 생각하는 것 이외에는 큰 의미가 없는 경우가 대부분이며 따라서 분수로 생각하지 마라 라는 말도 충분히 일리가 있는 설명이 됩니다.

 

고계도함수의 표기

여기서 잠깐 고계도함수의 표기에 대해서도 짚고 넘어가겠습니다.

이계도함수를 \(\frac{\mathrm{d}^2y}{\mathrm{d}x^2}\)으로 표기하는 것은 다 아실 텐데요.

이러한 표기에 대한 설명으로 \(\frac{ \mathrm{d} y}{ \mathrm{d} x}\)라는 표기를 \(\frac{ \mathrm{d}}{ \mathrm{d} x}\)의 미분연산자가 \(y\)에 적용된 형태로 봐서 \(\frac{ \mathrm{d}}{ \mathrm{d} x}\frac{ \mathrm{d} y}{ \mathrm{d} x}=\frac {\mathrm {d}^2y}{\mathrm {d} x^2}\)이다 하는 설명이 많이 사용됩니다만, 이는 표기사용 이유에 대한 명확한 설명이라기보다는 이미 기존에 관례적으로 사용되어 온 표기를 정당화하여 납득시키려는 설명에 가깝습니다.

이러한 정당화는 완전하지 않는데, \(\frac{\mathrm{d}}{\mathrm{d}x}\)를 연산자로 생각한다면 자연스러운 표기는 \( \frac{\mathrm{d^2}}{(\mathrm{d}x)^2}\) 이 아니라 \(\left(\frac{\mathrm{d}}{\mathrm{d}x}\right)^2\) 가 되어야 할 것이고 또한 \(\frac{\mathrm{d^2}}{\mathrm{d^2}x^2}\) 등의 표기는 왜 배제하는지에 대한 것도 명확하게 설명해 주지 못하기 때문입니다.

 

역사적으로 고계도함수의 표기는 미분연산자의 반복적용이 아니라 라이프니츠 때부터 다루었던 \(\mathrm{d}^n y\)등의 higher order differential에 대한 관점에서 정당화 되어 형성된 것입니다.

코시의 원전에서도 \(\frac{ \mathrm{d}}{ \mathrm{d} x} y\)등의 미분연산자 형식으로 이를 설명하지 않았습니다. 그저 \(\mathrm{d}^2y\)라는 2nd order differential을 derivative를 이용해 정의하였고, 이를 이용해 \(\mathrm{d}^2 y=f''(x)(\mathrm{d}x)^2\) 라는 식을 도출하며 2nd order differential과 2nd order derivative의 관계를 설명했을 뿐입니다.

코시의 원전에서의 설명은 현대수학의 관점에서 빈약한 부분이 있습니다만 이는 프레셰미분의 개념으로서 엄밀화될 수 있습니다.

 

현대수학의 differential

코시가 정의한 differential은 결국 증분함수 increment function \(\Delta y(h)=f(a+h)-f(a)\)에 대한 선형근사함수(혹은 주요선형부분)이 됩니다. 따라서 이러한 관점에서 현대 수학에서는 differential을 다음과 같이 정의합니다.

 

함수 \(y=f(x)\)와 한점 \(a\)에 대해

$$\lim_{h \to 0}\frac{(f(a+h)-f(a))-L(h)}{|h|}=0 $$

을 만족하는 선형함수\(L\)을 함수\(f\)의 \(a\)점에서의 미분 differential이라고 하고 이를 \(\mathrm{d}y\)라고 정의할 수 있습니다.

이러한 미분의 정의에 의해 \(\mathrm{d} y\)는 증분함수 \(\Delta y(h)=f(a+h)-f(a)\)의 원점 근방의 선형근사함수가 됩니다.

 

REMARK. \(\Delta y(h)=\mathrm{d}y(h)+\varepsilon(h)\)의 형태로서 보면 \(\varepsilon(h)\)는 \(\lim_{h\to0}\frac{\varepsilon(h)}{\left|h\right|}=0\) (즉 \(h\)보다 훨씬 더 빨리 0에 가까워짐)를 만족하여 선형함수 \( \mathrm{d}y(h)\)와 대비하면 무시 될 수 있는 오차부분이되므로 때때로 \(\mathrm{d}y\)는 \(\Delta y\)의 '주요선형부분 principal linear part'이라 불리기도 합니다.

 

이런 선형근사함수로서의 미분은 \( \mathrm{d} y=f'(x) \mathrm{d} x\)라는 형식적인 식을 도출할 수 있을 뿐만이 아니라 미분개념을 좀 더 넓은 공간에 대해서 확장할 때 아주 자연스러운 역할을 하게 되는데요.

선형함수라는 것이 단순히 '실수에서 선으로 나타나는 함수'라는 것이 아니라 '추상적인 공간인 벡터공간에서 선형성이라는 특정조건을 만족하는 함수'라는 것으로 추상화될 수 있기 때문입니다.

따라서 다변수함수로의 확장은 물론이고 더 나아가서 거리라는 개념이 정의된 벡터공간이면 이러한 미분개념을 적용시킬 수 있게 됩니다.

이러한 확장된 미분을 프레셰미분이라 합니다.

 

실수의 다변수벡터 함수의 경우에는 이 선형함수로 정의되는 미분이 선형대수학의 기본정리에 의해 \(L(x)=Ax\) 로서 상수 행렬\(A\)가 변수 \(x\)앞에 계수로서 곱해지는 간단한 형태로 표현됩니다.

그래서 이 행렬 \(A\)를 미분 differential의 계수 coefficient로서 미분계수 differential coefficient라고 부를 수 있고 또한 흔히 야코비 행렬 jacobian matrix라고도 부릅니다.

 

전미분 total derivative

이러한 differential은 미적분학에서 때때로 전미분 total derivative라는 용어로 다음과 같은 공식으로 소개 됩니다.

 

이변수 스칼라 함수 \(f:\mathbb{R}^2\to\mathbb{R}\)에 대해
$$\mathrm{d}f=\frac{\partial f}{\partial x}\mathrm{d}x+\frac{\partial f}{\partial y}\mathrm{d}y$$

 

이때의 \(\mathrm{d}f\)가 위에서 정의한 선형근사함수로서의 differential로, 각 점 \( (a,b) \)에서 정의되는

$$\mathrm{d}f_{(a,b)}(h_1,h_2)=\begin{bmatrix}\frac{\partial f}{\partial x}(a,b) & \frac{\partial f}{\partial y}(a,b)\end{bmatrix}\begin{bmatrix}h_1\\ h_2\end{bmatrix}$$

$$=\frac{\partial f}{\partial x}(a,b)h_1+\frac{\partial f}{\partial y}(a,b)h_2$$

의 선형함수를 말합니다. 이때 계수의 형태가 편미분의 형태로 나타남은 differential의 정의로 부터 간단히 증명하여 보일수 있습니다.

또한 \(x\)와 \(y\)를 각각 \( x(x,y)=x\)와 \( y(x,y)=y \) 으로 표기할수 있는 함수를 나타내는 표기라고 볼 때 이러한 함수에 대해 differential을 똑같이 생각하면 \( \mathrm{d}x(h_1,h_2)=h_1 \) , \( \mathrm{d}y(h_1,h_2)=h_2 \) 가 되므로 공식이 성립하게 됩니다.

이러한 \( \mathrm{d}x \)와 \( \mathrm{d}y \)의 설명을 '독립변수의 증분'이라는 형태로 모호하게 설명하여 혼란을 주는 경우가 많은 것은 안타까운점입니다.

 

REMARK.

이 지점에서 derivative와 differential의 두 용어 사용에 대한 애매모호한 구분으로 불편함이 생길 수 있는데 differential은 어디까지나 선형근사함수(또는 무한소)에 대한 개념을 나타내는 용어지만 derivative는 특정개념(예를 들면 순간변화율)을 나타내기 위한 용어라기보다 우리가 전체적인 미분논리를 전개하기 위한 기본적인 도구에 붙여주는 이름으로 이해하여야 합니다.
가령 다변수함수의 derivative의 값으로서 '미분계수'인 야코비 행렬을 생각할 수도(munkres), differential 그 자체를 값으로 생각하여 사용할 수도 있고(spivak), 이는 기본적인 도구의 형태를 무엇으로 세팅하냐의 선택일 뿐입니다.

따라서 derivative라는 용어는 전미분, 편미분, 방향미분 directional derivative, 외미분 exterior derivative 등으로 보다 광범위하게 사용할 수 있는 용어입니다.

 

REMARK2.

간혹 total differential이라는 용어로서 differential이 사용되는 경우가 있는데 이는 어떤 구분을 위한 사용이라기 보다 total derivative와 differential의 용어의 혼재에 의한 사용일때가 많습니다. Total derivative의 경우 partial derivative와의 구분을 위해 total을 붙여 구분하는것이 의미가 있지만 partial differential이라는 개념은 거의 소개되지 않기 때문에 differential에 접두사 total을 붙일 필요성은 그리 크지 않습니다. (Partial differential의 개념은 rodney coleman - calculus on normed vector spaces 을 참고하세요.)
apstol,lee 등의 교재에서 선형근사함수를 total derivative의 용어로 정의하며 rudin은 특히 선형근사함수로서 derivative를 정의하면서 'partial derivative와의 구분을 위해 이를 total derivative라 부를 수 있고 또한 이는 때로 differential이라 불린다'라고 명시했습니다.

 

미분계수 differential coefficient라는 용어

마지막으로 differential coefficient라는 용어에 대해서 개인적인 의견으로 끝마치고자 합니다.

개인적으로 현재 교과과정에서 미분계수라는 용어를 쓰는 것 자체에 대해서 굉장히 부정적입니다.

미분계수라는 용어자체는 수학적으로 타당한 용어이고 그리고 역사적으로도 오일러와 코시가 사용한 용어입니다.

그런데 현재 영어권에서는 아예 미분계수라는 용어자체가 더 이상 쓰이지 않습니다.

결국 미분계수라는 용어를 이해하고 받아들이기 위해서는 위에서 말한 역사적인 내용들과 선형함수로서의 미분이라는 현대적인 미분개념의 내용까지 알아야 하기 때문에 굉장히 많은 배경지식이 필요하고, 따라서 굳이 이러한 용어를 쓸 필요는 없습니다.

특히나 미분이라는 개념을 처음 접하는 고등학생에게 이러한 용어의 무분별한 제시는 잘못된 이해로 이어질 수도 있으며 따라서 근본적으로는 용어사용의 재고려가 필요하고, 현 교과과정상에서 어쩔 수 없이 이러한 용어를 사용해야 될 경우에는 단순하게 용어만을 제시하는 것 이상의 지도가 이루어져야 할 것입니다.

 

 

참고도서

Cates, Dennis M - Cauchy’s Calcul Infinitésimal

Carl B. Boyer - The History of the Calculus and Its Conceptual Development

H.J.M.Bos - Differentials, Higher-Order Differentials and the Derivative in the Leibnizian Calculus

한대희 - 미분법 단원에서 용어의 문제

 

참고링크

https://en.wikipedia.org/wiki/Differential_of_a_function

https://en.wikipedia.org/wiki/Fr%C3%A9chet_derivative

https://math.stackexchange.com/questions/25102/why-is-the-2nd-derivative-written-as-frac-mathrm-d2y-mathrm-dx2