常用的微分运算法则

作者: kamidox | 来源:发表于2015-09-28 22:12 被阅读792次

继续用公式轰炸简书,谁叫简书写作体验这么好呢~~
老规矩,万一真有人想阅读这些公式,请移步这里

机器学习涉及到较多的数学知识,在工程应用领域,这些数学知识不是必要的,其实很多算法都是数值运算专家写好了的。然而知其然知其所以然,了解这些数学公式的来龙去脉是帮助理解算法的关键。本文直接给出常用的微分运算法则,并运用这些法则来计算分类回归算法 (Logistic Regression) 预测模型 Sigmoid Function 的微分公式。

基础函数的微分运算法则

  • 幂函数法则
    $$\begin{align} \frac{d}{dx} x^n = nx^{n-1} \end{align}$$
  • 指数函数法则
    $$\begin{align} \frac{d}{dx} e^x = e^x \end{align}$$
    $$\begin{align} \frac{d}{dx} a^x = ln(a)a^x \end{align}$$
  • 对数函数法则
    $$\begin{align} \frac{d}{dx} ln(x) = \frac{1}{x} \end{align}$$
    $$\begin{align} \frac{d}{dx} log_a(x) = \frac{1}{xln(a)} \end{align}$$
  • 三角函数法则
    $$\begin{align} \frac{d}{dx} sin(x) = cos(x) \end{align}$$
    $$\begin{align} \frac{d}{dx} cos(x) = -sin(x) \end{align}$$
    $$\begin{align} \frac{d}{dx} tan(x) = sin^2(x) = \frac{1}{cos^2(x)} = 1 + tan^2(x) \end{align}$$
  • 反三角函数法则
    $$\begin{align} \frac{d}{dx} arcsin(x) = \frac{1}{\sqrt{1-x^2}}, -1 < x < 1 \end{align}$$
    $$\begin{align} \frac{d}{dx} arccos(x) = -\frac{1}{\sqrt{1-x^2}}, -1 < x < 1 \end{align}$$
    $$\begin{align} \frac{d}{dx} arctan(x) = \frac{1}{1+x^2} \end{align}$$

组合函数的微分运算法则

  • 常数法则:如果 $f(x) = n$,n 是常数,则
    $$\begin{align} f' = 0 \end{align}$$
  • 加法法则
    $$\begin{align} (\alpha f + \beta g)' = \alpha f' + \beta g' \end{align}$$
  • 乘法法则
    $$\begin{align} (fg)' = f'g + fg' \end{align}$$
  • 除法法则
    $$\begin{align} \left( \frac{f}{g} \right)' = \frac{f'g - fg'}{g^2} \end{align}$$
    根据除法法则和指数法则,可以得出推论
    $$\frac{d}{dx} e^{-x} = \frac{d}{dx} \frac{1}{e^x} = \frac{0-ex}{e{2x}} = -\frac{1}{e^x} = -e^{-x}$$
  • 链接法则:如果 $f(x) = h(g(x))$,则
    $$\begin{align} f'(x) = h'(g(x)) g'(x) \end{align}$$

计算 Sigmoid Function 的微分

$g(x) = \frac{1}{1+e^{-x}}$ 是分类算法的预测函数,也称为 Sigmoid Function 或 Logistic Function。我们利用上文介绍的微分运算法则来证明 Sigmoid Function 的一个特性:

$$
\frac{d}{dx} g(x) = g(x) (1 - g(x))
$$

方法一

假设 $f(x) = \frac{1}{x}$,则 $f(g(x)) = \frac{1}{g(x)}$,根据除法法则得到

$$
\begin{align}
f'(g(x)) & = \left( \frac{1}{g(x)} \right)' = \frac{1' g(x) - 1 g'(x)}{g(x)^2} \\
& = - \frac{g'(x)}{g(x)^2}
\end{align}
$$

其中 (17) 是根据除法法则得出的结论,除数是常数函数 1,被除数是 $g(x)$。(18) 是根据常数法则得出的结论。

另一方面,$f(g(x)) = \frac{1}{g(x)} = 1 + e^{-x}$,根据指数法则直接计算微分得到

$$
\begin{align}
f'(g(x)) & = \frac{d}{dx} (1 + e^{-x}) \\
& = -e^{-x} \\
& = 1 - \frac{1}{g(x)} \\
& = \frac{g(x) - 1}{g(x)}
\end{align}
$$

(18) 和 (22) 两式是相等的,即

$$
\begin{align}

  • \frac{g'(x)}{g(x)^2} & = \frac{g(x) - 1}{g(x)} \\
    g'(x) & = g(x)(1 - g(x))
    \end{align}
    $$

这样就得到了我们的结果。

方法二

由 $g(x) = \frac{1}{1+e^{-x}}$ 的定义可知

$$
\begin{align}
& (1+e^{-x})g(x) = 1 \\
\Rightarrow & \frac{d}{dx} \left( (1+e^{-x})g(x) \right) = 0 \\
\Rightarrow & -e^{-x}g(x) + (1+e^{-x})\frac{d}{dx}g(x) = 0 \\
\Rightarrow & \frac{d}{dx}g(x) = g(x) \frac{e{-x}}{1+e{-x}} \\
\Rightarrow & \frac{d}{dx}g(x) = g(x) \frac{(1 + e^{-x}) - 1}{1+e^{-x}} \\
\Rightarrow & \frac{d}{dx}g(x) = g(x) \left[ 1 - \frac{1}{1+e^{-x}}\right] \\
\Rightarrow & \frac{d}{dx}g(x) = g(x) (1 - g(x)) \\
\end{align}
$$

(26) 两边取微分;(27) 根据微分的乘法法则。

方法三

根据除法法则直接计算微分:

$$
\begin{align}
\frac{d}{dx} g(x) & = \frac{d}{dx} \left( \frac{1}{1 + e^{-x}} \right) \\
& = \frac{0 - (- e^{-x})}{(1 + e{-x})2} \\
& = \frac{e^{-x}}{(1 + e{-x})2} \\
& = \frac{1}{(1 + e^{-x})} \frac{e^{-x}}{(1 + e^{-x})} \\
& = \frac{1}{(1 + e^{-x})} \frac{(1 + e^{-x}) - 1}{(1 + e^{-x})} \\
& = \frac{1}{(1 + e^{-x})} \left[1 - \frac{1}{(1 + e^{-x})} \right] \\
& = g(x) (1 - g(x)) \\
\end{align}
$$

(33) 是根据除法法则得出的,其中除数是常数 1,被除数是 $1 + e^{-x}$。

参考资料

相关文章

  • 常用的微分运算法则

    继续用公式轰炸简书,谁叫简书写作体验这么好呢~~老规矩,万一真有人想阅读这些公式,请移步这里。 机器学习涉及到较多...

  • 2018-01-24课后总结

    今天郭老师先讲了一下PID,即P:比例运算,I:积分运算,D:微分运算,其中微分运算不会独立进行。之后在昨天讲解的...

  • 机器学习中的数学基础之微积分

    常用符号: 重要极限: 常用微分: 偏分 求导法则 泰勒级数的本质是多项式逼近 牛顿法和梯度下降法 牛顿法知道逼近...

  • 数学在讲个啥?

    一、数学书籍逻辑 定义 定理 定理衍生的推论 性质 运算法则 常用结论 二、数学运算层次: 1:+ - 2: 4....

  • 基本初等函数的微分与微分运算法则

  • 小学生学习计算过程中心理特点分析

    一、小学生运算中推理能力的发展特点。 二、小学生运算法则的掌握。 1、自然数运算的最基本法则的掌握 2、运算中思维...

  • Python 入门之常用运算符

    Python中的运算按种类可分为算数运算、比较运算、逻辑运算、赋值运算、成员运算、身份运算、位运算 1、常用运算符...

  • 2022-07-30

    运算能力主要是指根据法则和运算律进行正确运算的能力。 拥有运算能力首先表现为:能够明晰运算的对象和意义,理解算法与...

  • 第二讲:动力学方程的数值积分

    计算机动画的本质上是解微分方程,因此本文主要介绍微分方程常用的一些解法。 particle system 首先从最...

  • 爬坑:彻底搞懂php自加自减运算

    核心运算原则: 1、整个运算式按照正常运算法则运算,例如简单的从左往右运算,只要前两项不包含自加自减运算,就先算出...

网友评论

    本文标题:常用的微分运算法则

    本文链接:https://www.haomeiwen.com/subject/ambwcttx.html