微分,导数,导函数,链式法则

-- TOC --

微分的思想很简单直接,就是“以直代曲”,“线性近似”,"无限逼近"。

比如可以用内接\(N\)边型的方式来推导圆的面积公式,用\(N\)个小矩形面积的和来计算曲线与x轴之间的面积等。(\(N\rightarrow +\infty\))

微分的定义

设函数\(y=f(x)\)在某区间内有定义,\(x_0\)及\(x_0+\Delta x\)在此区间内,如果函数增量:

\(\Delta y=f(x_0+\Delta x)-f(x_0)\)

可表示为:

\(\Delta y=A\Delta x+o(\Delta x)\)

其中\(A\)是不依赖于\(\Delta x\)的常数,那么称函数\(y=f(x)\)在点\(x_0\)是 可微 的,而\(A\Delta x\)叫作函数\(y=f(x)\)在点\(x_0\)相应于自变量增量\(\Delta x\)的 微分 ,记作\(\textrm{d}y\),即:

\(\textrm{d}y=A\Delta x\)

通常令\(\mathrm{d}x=\Delta x\),所以微分又可表示为:

$$\textrm{d}y=A\cdot\mathrm{d}x$$

\(o(\Delta x)=\Delta y - A\Delta x\),这表示用来线性近似的直线与函数原值相差一个相对于\(\Delta x\)的高阶无穷小

\(\lim_{\Delta x \rightarrow 0}\cfrac{o(\Delta x)}{\Delta x}=0\)

该直线就是\(f(x_0)\)点及其附近曲线的“线性近似”!这条直线就是\(f(x_0)\)点的切线(tangent line)。

导数

上述微分的定义中,A就是导数。

$$\begin{align} \Delta y &= A\Delta x+o(\Delta x) \notag\\ \frac{\Delta y}{\Delta x} &= A + \frac{o(\Delta x)}{\Delta x}\notag\\ \end{align}$$

显然就有:

$$\begin{align} \lim_{\Delta x\rightarrow 0}\frac{\Delta y}{\Delta x}&=\lim_{\Delta x\rightarrow 0}\frac{f(x+x_0)-f(x)}{\Delta x}\notag\\ &=A\notag\\ &=f'(x_0)\notag\\ &=\cfrac{dy}{dx}\bigg|_{x=x_0}\end{align}$$

这就是导数的定义式。

\(\cfrac{dy}{dx}\bigg|_{x=x_0}\)不是除法,是上述极限式的简写。但从微分定义角度看,的确又是个除法。有点混乱,注意内涵!(微积分的发展经历了数百年,牛顿、莱布尼兹、柯西、欧拉、魏尔斯特拉斯等各位大佬一把屎一把尿把它抚养成人,中间产生了一个问题,就是符号有些混乱)

这个极限存在,即说明\(f(x)\)在\(x_0\)处可导,这个极限就是导数。

导数还可以写成:

\(y^{'}|_{x=x_0}\)

\(\cfrac{dy}{dx}\bigg|_{x=x_0}\)

\(\cfrac{df(x)}{dx}\bigg|_{x=x_0}\)

\(\cfrac{d}{dx}f(x)\Bigg|_{x=x_0}\)

导数就是用来做微分近似的那条直线的斜率,微分存在,导数必然存在,因此,可微就可导,可导就可微

微分是\(dy\),导数是\(\cfrac{dy}{dx}\),导数是微分的斜率,是变化率或敏感度。

微分和导数,从定义上看,都是一个数。求微分,关键就是求导数,求导数,就是在求极限。

下面这段文字,是我在另外一份教材上看到的,说的就是导数定义式左右两边并不都是除法:

A technical note is that the division sign on the left-hand side is, unlike the division sign on the right-hand side, not a division. Instead, this notation indicates that the operator \(\cfrac{d}{dx}\) is being applied to the function \(f\), and returns a different function (the derivative).

The derivative on each variable tells you the sensitivity of the whole expression on its value.

左右导数

如下极限存在的话,则称之为函数\(y=f(x)\)在点\(x_0\)处的 左导数 (left-hand derivatives),记作\(f'_-(x_0)\):

$$f_{-}^{'}(x_0)=\lim_{\Delta x\rightarrow 0^-}\cfrac{f(x_0+\Delta x)-f(x_0)}{\Delta x}$$

或如下极限存在的话,则称之为函数\(y=f(x)\)在点\(x_0\)处的 右导数 (right-hand derivatives),记作\(f'_+(x_0)\):

$$f_{+}^{'}(x_0)=\lim_{\Delta x\rightarrow 0^+}\cfrac{f(x_0+\Delta x)-f(x_0)}{\Delta x}$$

可导的充要条件

左右导数存在且相等:

$$f_{-}^{'}(x_0)=f_{+}^{'}(x_0)=f^{'}(x_0)$$

可导与连续

可导必然连续

如果函数\(f(x)\)在\(x_0\)可导,那么函数在\(x_0\)点必然连续。

连续不一定可导

比如函数图形不全是曲线,有突变的点。

可导意味着曲线平滑,没有突变点。

导函数

若函数\(y=f(x)\)在开区间\(I\)内的每个点都可导,则称函数\(y=f(x)\)在开区间\(I\)内可导。

此时,\(\forall x\in I\),都对应这\(f(x)\)一个确定的导数值,这就构成了新的函数,该函数叫做\(y=f(x)\)的导函数,记作\(y^{'},f^{'}(x),\cfrac{dy}{dx},\cfrac{df(x)}{dx}\)。定义式为:

$$y^{'}=f^{'}(x)=\lim_{\Delta x\rightarrow 0}\cfrac{f(x+\Delta x)-f(x)}{\Delta x}$$

定义在开区间,可能是避免了说明左右导数的麻烦。

不要把导数和导函数混在一起分不清楚了,注意上下文。

常数函数的导函数

常数函数\(f(x)=C,C\in R\),其导函数为0:

\(f'(x)=0\)

幂函数的导函数

对于幂函数\(f(x)=x^a,a\in R\),其导函数为:

\(f'(x)=a\cdot a^{a-1}\)

三角函数的导函数

\((\sin{x})'=\cos{x}\)

\((\cos{x})'=-\sin{x}\)

有了这两个公式,再结合洗下面求导函数的法则,可以很轻松的得到:

\((\tan{x})'=\sec^2{x}\)

\((\cot{x})'=-\csc^2{x}\)

\((\sec{x})'=\sec{x}\cdot\tan{x}\)

\((\csc{x})'=-\csc{x}\cdot\cot{x}\)

反三角函数的导函数

\((\arcsin{x})'=\cfrac{1}{\sqrt{1-x^2}}\)

\((\arccos{x})'=-\cfrac{1}{\sqrt{1-x^2}}\)

\((\arctan{x})'=\cfrac{1}{1+x^2}\)

\((arccot\text{ x})^{'}=-\cfrac{1}{1+x^2}\)

指数函数的导函数

当\(f(x)=a^x,a\gt0,a\neq1\)

\(f'(x)=a^x\cdot \ln{a}\)

特别的当\(f(x)=e^x\)时,\(f'(x)=e^x\)

对数函数的导函数

当\(f(x)=\log_a{x},a\gt0,a\neq1\)

\(f'(x)=\cfrac{1}{x\ln{a}}\)

特别的当\(f(x)=\ln{x}\)时,\(f'(x)=\cfrac{1}{x}\)

求导(函数)法则

函数和差的导函数

如果函数\(f(x)\)和\(g(x)\)在\(x\)点处可导,

\((f(x)\pm g(x))^{'}=f^{'}(x)\pm g^{'}(x)\)

函数积的导函数

product rule

如果函数\(f(x)\)和\(g(x)\)在\(x\)点处可导,

\(f(x)\cdot g(x)=f'(x)\cdot g(x) + f(x)\cdot g'(x)\)

对于有3部分相乘的product rule:

如果\(y=uvw\),那么:

\(\cfrac{dy}{dx}=\cfrac{du}{dx}vw+\cfrac{dv}{dx}uw+\cfrac{dw}{dx}uv\)

函数商的导函数

quotient rule

如果函数\(f(x)\)和\(g(x)\)在\(x\)点处可导,以及\(g(x)\neq0\),

\(\biggl(\cfrac{f(x)}{g(x)}\biggr)'=\cfrac{f'(x)g(x)-f(x)g'(x)}{g^2(x)}\)

链式法则

复合函数的导函数,链式法则,chain rule,人工智能算法由它推导!

如果\(u=g(x)\)在\(x\)可导,而\(y=f(u)\)在\(u\)点可导,那么复合函数\(y=f(g(x))\)在\(x\)点可导,其导函数为:

$$\bigl(f(g(x))\bigr)'=f'(u)\cdot g'(x)=\cfrac{dy}{du}\cdot\cfrac{du}{dx}$$

\(\cfrac{dy}{du}和\cfrac{du}{dx}\)这里绝对不是除法,不能约分,他们是两个极限表达式的缩写。

当然,链式法则也可以有更多级:

\(\cfrac{dy}{dx}=\cfrac{dy}{du}\cdot\cfrac{du}{dv}\cdot\cfrac{dv}{dx}\)

反函数的求导(函数)法则

如果函数\(y=f(x)\)在区间\(I_x\)内严格单调,可导,且\(f'(x)\neq0\),那么它的反函数\(f^{-1}(y)\)在对应的区间\(I_y=\{y|y=f(x),x\in I_x\}\)也可导,且:

\(\bigl(f^{-1}(y)\bigr)'=\cfrac{1}{f'(x)}\)

严格单调已经包含了导数不为0这个条件。

隐函数求导

型如\(y=f(x)\)的函数,叫做显函数(explicit function),否则就是隐函数(implicit function)

有一些隐函数,可以转换成显函数,有一些就不行。

有一个判断隐函数是否存在的定理,还不会。

隐函数直接求导

隐函数不能将y和x分开,因此在求导的时候,同时对等号两边针对x进行求导,使用上文所述的各种求导法则。注意对y用x求导时,因为隐函数,要使用链式法则,得到一个含有\(\cfrac{dy}{dx}\)的表达式,我们要求的,就是\(\cfrac{dy}{dx}=...\)

隐函数对数求导

等号两边去对数,可以把幂运算简化为乘法,可以把乘除简化为加减。然后再两边对x求导。一般都取自然对数,进一步方便计算。

参数方程求导

定理,对于参数方程:

\(\begin{cases} x=f(t) \\ y=g(t) \\ \end{cases}\)

x和y存在函数关系,可直接用链式法则证明此定理。

那么,\(\cfrac{dy}{dx}=\cfrac{dy}{dt}\cdot\cfrac{dt}{dx}=\cfrac{dy}{dt}\cdot\cfrac{1}{\frac{dx}{dt}}=\cfrac{g'(t)}{f'(t)}\)

参数方程的二阶导数,由于一阶导数得到的依然是一个含有t的表达式,因此再来这么一次。

高阶导函数

前面说的都是一阶导函数(first order derivative)。

二阶导函数(second order derivatives)为:

\((y')'=f''(x)=\cfrac{d^{2}y}{dx^2}=\cfrac{d}{dx}(y')\)

对函数y求两次导数,每一个\(dx\)表示对x求导一次。

位移的一阶导数是瞬时速度,二阶导数是加速度。

N接导函数(N-th order derivatives):

\(y^{(n)}=f^{(n)}=\cfrac{d^{n}y}{dx^n}\)

本文链接:https://cs.pynote.net/math/202208061/

-- EOF --

-- MORE --