美文网首页我爱编程
“大黄卖猪”解读深度学习之导数

“大黄卖猪”解读深度学习之导数

作者: 石雨城倾 | 来源:发表于2017-08-08 10:55 被阅读0次

           今天,面对 AI 如此重要的江湖地位,深度学习作为重要的一个研究分支,几乎出现在当下所有热门的 AI 应用领域,其中包含语义理解、图像识别、语音识别,自然语言处理等等,更有人认为当前的人工智能等同于深度学习领域。

            如果在这个人工智能的时代,作为一个有理想抱负的程序员,或者学生、爱好者,不懂深度学习这个超热的话题,似乎已经跟时代脱节了。

            但是,深度学习对数学的要求,包括微积分、线性代数和概率论与数理统计等,让大部分的有理想抱负青年踟蹰前行。那么问题来了,理解深度学习,到底需不需要这些知识?

            深度学习所需要的数学基础并没有想象中的那么难,只需要知道导数和相关的函数概念即可。假如你高等数学也没学过,很好,这篇文章其实是想让文科生也能看懂,只需要学过初中数学。

            不必有畏难的情绪,我比较推崇李书福的精神,在一次电视采访中,李书福说:谁说中国人不能造汽车?造汽车有啥难的,不就是四个轮子加两排沙发嘛。当然,他这个结论有失偏颇,不过精神可嘉。

            导数无非就是变化率,比如:大黄今年卖了 100 头猪,去年卖了 90 头,前年卖了 80 头。。。变化率或者增长率是什么?每年增长 10 头猪,多简单。

            这里需要注意有个时间变量---年。大黄卖猪的增长率是 10头/年,也就是说,导数是 10。

            函数 y = f(x) = 10x + 30,这里我们假设大黄第一年卖了 30 头,以后每年增长 10 头,x代表时间(年),y代表猪的头数。

            当然,这是增长率固定的情形,而现实生活中,很多时候,变化量也不是固定的,也就是说增长率不是恒定的。

            比如,函数可能是这样: y = f(x) = 5x² + 30,这里 x 和 y 依然代表的是时间和头数,不过增长率变了,怎么算这个增长率,我们回头再讲。或者你干脆记住几个求导的公式也可以。

            深度学习还有一个重要的数学概念:偏导数

            我们还以大黄卖猪为例,刚才我们讲到,x 变量是时间(年),可是卖出去的猪,不光跟时间有关啊,随着业务的增长,大黄不仅扩大了养猪场,还雇了很多员工一起养猪。

            所以方程式又变了:y = f(x) = 5x₁² + 8x₂ + 35x₃ + 30

            这里 x₂ 代表面积,x₃ 代表员工数,当然 x₁ 还是时间。

            偏导数无非就是多个变量的时候,针对某个变量的变化率。在上面的公式里,如果针对 x₃ 求偏导数,也就是说,员工对于猪的增长率贡献有多大。

            或者说,随着(每个)员工的增长,猪增加了多少,这里等于 35---每增加一个员工,就多卖出去 35 头猪。

             计算偏导数的时候,其他变量都可以看成常量,这点很重要,常量的变化率为 0,所以导数为 0,所以就剩对 35x₃ 求导数,等于 35。对于 x₂ 求偏导,也是类似的。

             求偏导,我们用一个符号表示:比如 y / x₃ 就表示 y 对 x₃ 求偏导。

            深度学习是采用神经网络,用于解决线性不可分的问题

            本次分享就先写到这,下次文章回具体说明导数在深度学习中的应用

    相关文章

      网友评论

        本文标题:“大黄卖猪”解读深度学习之导数

        本文链接:https://www.haomeiwen.com/subject/oqqtrxtx.html