交叉熵损失函数和focal loss

交叉熵损失函数和focal loss

作者: 骆旺达 | 来源:发表于2021-03-30 11:41 被阅读0次

Focal Loss 原理及实践
AI面试第四弹(CV常问loss之focal loss)
交叉熵损失函数和focal loss
交叉熵损失函数原理详解
交叉熵损失函数
多分类问题的交叉熵计算
简单的交叉熵损失函数，你真的懂了吗？
人工智能实践：Tensorflow笔记2
Sklearn中二分类问题的交叉熵计算
Maximum Likelihood 和 Maximum A P

交叉熵

交叉熵是信息论中的一个重要概念，主要用于度量两个概率分布间的差异性。是分类问题中经常使用的一种损失函数。

一般使用交叉熵作为损失函数时，在模型的输出层总会接一个softmax函数（用来获得结果分布）。

交叉熵公式：

$H(p,q) = -\sum_i{p（x_i）log(q(x_i))}$

用来衡量真实概率分布 $P(x)$ 和预测标签分布 $Q(x)$ 之间的差异；

要了解交叉熵就需要先了解下述概念：

信息量

信息熵：“信息是用来消除随机不确定性的东西”，也就是说衡量信息量的大小就是看这个信息消除不确定性的程度。

信息量的大小与信息发生的概率成反比。概率越大，信息量越小。概率越小，信息量越大。例如：”2018年中国队成功进入世界杯“，从直觉上来看，这句话具有很大的信息量。因为中国队进入世界杯的不确定性因素很大，发生的概率很小；

设某一事件发生的概率为P(x)，其信息量表示为：
$I（x） = - log(P(x))$

信息熵

信息熵也被称为熵，用来表示所有信息量的期望；

期望是试验中每次可能结果的概率乘以其结果的总和。

所以信息量的熵可表示为：（这里的X XX是一个离散型随机变量）
$H(x)=-\sum_i^{n}{P(x_i)log(P(xi))}$

相对熵（KL散度）

如果对于同一个随机变量 $X$ 有两个单独的概率分布 $P ( x )$ 和 $Q ( x )$ ，则我们可以使用KL散度来衡量这两个概率分布之间的差异。

直接上公式
$D_{KL}(p|q) = \sum_{i=1}^{n}p(x_i)log( \frac{p(x_i)}{q(x_i)})$
KL散度越小，表示 $P ( x )$ 和 $Q ( x )$ 的分布更加接近。

比如在一个三分类任务中（例如，猫狗马分类器）， $x_1,x_2,x_3$ 分别代表猫，狗，马。

例如一张猫的图片真实分布 $P ( x )=[1,0,0]$ 和 $Q(x)=[0.7,0.2,0.1]$ ,计算KL散度:

KL散度

交叉熵

将KL散度公式拆开：

KL散度拆开

前者 $H(p(x))$ 表示信息熵，后者即为交叉熵，KL散度 = 交叉熵 - 信息熵
交叉熵公式为：
$H(p,q) = -\sum_i{p（x_i）log(q(x_i))}$
交叉熵等于KL散度加上一个常量（信息熵），且公式相比KL散度更加容易计算，所以在机器学习中常常使用交叉熵损失函数来计算loss就行了。

Focal loss损失函数

Focal Loss的引入主要是为了解决**难易样本数量不平衡****（注意，有区别于正负样本数量不平衡）的问题，实际可以使用的范围非常广泛。

本文的作者认为，易分样本（即，置信度高的样本）对模型的提升效果非常小，模型应该主要关注与那些难分样本。一个简单的思想：把高置信度(p)样本的损失再降低一些不就好了吗！

focal loss函数公式：
$FL(p) = -a(1-p)^\lambda log(p)$
其中， $a$ 为类别权重，用来权衡正负样本不均衡问题； $\lambda$ 表示难分样本权重，用来衡量难分样本和易分样本；

相关文章

Focal Loss 原理及实践
1 关于Focal Loss Focal Loss 是一个在交叉熵(CE)基础上改进的损失函数，来自ICCV201...
AI面试第四弹(CV常问loss之focal loss)
一、二分类focal loss 1、一句话概括： focal loss，这个损失函数是在标准交叉熵损失基础上修改得...
交叉熵损失函数和focal loss
交叉熵交叉熵是信息论中的一个重要概念，主要用于度量两个概率分布间的差异性。是分类问题中经常使用的一种损失函数。 ...
交叉熵损失函数原理详解
交叉熵损失函数原理详解之前在代码中经常看见交叉熵损失函数(CrossEntropy Loss)，只知道它是分类问...
交叉熵损失函数
转自简单的交叉熵损失函数，你真的懂了吗？说起交叉熵损失函数「Cross Entropy Loss」，脑海中立马浮现...
多分类问题的交叉熵计算
多分类问题的交叉熵在多分类问题中，损失函数（loss function）为交叉熵（cross entropy...
简单的交叉熵损失函数，你真的懂了吗？
说起交叉熵损失函数「Cross Entropy Loss」，脑海中立马浮现出它的公式：我们已经对这个交叉熵函数非...
人工智能实践：Tensorflow笔记2
1 损失函数 loss 均方误差 mse交叉熵 ce Cross Entropysoftmax（） 2学习率 ...
Sklearn中二分类问题的交叉熵计算
二分类问题的交叉熵在二分类问题中，损失函数（loss function）为交叉熵（cross entropy...
Maximum Likelihood 和 Maximum A P
前言在研究SoftMax交叉熵损失函数(Cross Entropy Loss Function)的时候，一种方法...

网友评论

本文标题：交叉熵损失函数和focal loss

本文链接：https://www.haomeiwen.com/subject/opgwhltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|交叉熵损失函数和focal loss|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！