美文网首页
交叉熵损失函数

交叉熵损失函数

作者: 张虾米试错 | 来源:发表于2021-05-03 08:24 被阅读0次

目录

  1. 二分类
  2. 多分类
  3. 为什么sigmoid激活函数,使用交叉熵损失函数更好?

1. 二分类

激活函数sigmoid
y' = sigmoid(z_i) = \frac{1}{1+e^{-z_i}}
这里要注意的是z_i是最后一层的输出,y'才是激活函数后的输出,为预测值。
二分类的交叉熵损失函数
L = -y \log y' - (1-y) \log (1-y')
这里的y=0y=1

2. 多分类

一般情况下,最后一个输出层的节点个数与分类任务的目标数相等。因此多分类最后一层用softmax得到每个类别的预测值。
激活函数softmax:
y'_i = softmax(z_i) = \frac{e^{z_i}}{\sum {e^{z_i}}}
因此\sum{y'_i}=1

损失函数
L = -\sum{y_i \log y'_i}
这里的y_i=0y_i=1
举例说明,假设任务是3分类问题,原始样本标签为y = [1, 0, 0],预测值为y' =[0.7, 0.2, 0.1],那么L = 1*\log 0.7 + 0*\log 0.2+0*\log 0.1

3. 为什么sigmoid激活函数,使用交叉熵损失函数更好?

下面以二分类为例进行说明。

数学推导,求损失函数的解必会有求导,因此我们对损失函数求导:
\frac{\partial L}{\partial y} = \frac{\partial L}{\partial y} * \frac{\partial y}{\partial z}
\frac{\partial L}{\partial y} = -\frac{y}{y'} + \frac{1-y}{1-y'}=\frac{y'-y}{y(1-y')}
\frac{\partial y}{\partial z} =\frac{e^{-z}} {(1+e^{-z})^2} = \frac{e^{-z}} {(1+e^{-z})} * \frac{1} {(1+e^{-z})} = y'(1-y')
\frac{\partial L}{\partial z} = y'-y
所以当误差大的时候,权重更新快;当误差小的时候,权重更新慢。这是一个很好的性质。

对比均方误差损失函数。
L = \frac{1}{2n} \sum (y_i-y_i')^2
\frac{\partial L}{\partial y} = y'-y
\frac{\partial y}{\partial z} =\frac{e^{-z}} {(1+e^{-z})^2} = \frac{e^{-z}} {(1+e^{-z})} * \frac{1} {(1+e^{-z})} = y'(1-y')
\frac{\partial L}{\partial z} = (y'-y) \frac{\partial y}{\partial z} = y'(1-y') (y'-y)
相比交叉熵损失函数,没有“误差更大权重更新越快”的性质。

学习资料

相关文章

  • 损失函数 - 交叉熵损失函数

    参考[1]损失函数 - 交叉熵损失函数

  • 交叉熵损失函数原理详解

    交叉熵损失函数原理详解 之前在代码中经常看见交叉熵损失函数(CrossEntropy Loss),只知道它是分类问...

  • 交叉熵损失函数

    转自简单的交叉熵损失函数,你真的懂了吗?说起交叉熵损失函数「Cross Entropy Loss」,脑海中立马浮现...

  • 理解熵,交叉熵和交叉熵损失

    交叉熵损失是深度学习中应用最广泛的损失函数之一,这个强大的损失函数是建立在交叉熵概念上的。当我开始使用这个损失函数...

  • Tensorflow & Keras的loss函数总结

    一、二分类与多分类交叉熵损失函数的理解 交叉熵是分类任务中的常用损失函数,在不同的分类任务情况下,交叉熵形式上有很...

  • 损失函数的选择

    回归问题常用:均值平方差损失函数(MSE);交叉熵问题常用交叉熵损失函数(CE)。 那为啥? 1.从原理上来讲,C...

  • 多分类问题的交叉熵计算

    多分类问题的交叉熵   在多分类问题中,损失函数(loss function)为交叉熵(cross entropy...

  • 简单的交叉熵损失函数,你真的懂了吗?

    说起交叉熵损失函数「Cross Entropy Loss」,脑海中立马浮现出它的公式: 我们已经对这个交叉熵函数非...

  • 损失函数

    聊聊机器学习中的损失函数 机器学习中的损失函数 平方损失(线性回归) 对数损失(交叉熵损失 softmax, lo...

  • 交叉熵损失函数

    交叉熵代价函数(Cross-entropy cost function)是用来衡量人工神经网络(ANN)的预测值与...

网友评论

      本文标题:交叉熵损失函数

      本文链接:https://www.haomeiwen.com/subject/axsttltx.html