交叉熵、GAN loss与softplus

作者: 吃远 | 来源:发表于2022-08-11 21:19 被阅读0次

交叉熵、GAN loss与softplus
多分类问题的交叉熵计算
【论文学习】《Dice Loss for Data-imbala
交叉熵损失函数原理详解
20180711记录
简单的交叉熵损失函数，你真的懂了吗？
交叉熵损失函数
Sklearn中二分类问题的交叉熵计算
机器学习值softmax
人工智能实践：Tensorflow笔记2

一、交叉熵理解：

交叉熵，其用来衡量在给定的真实分布P(x)下，使用非真实分布Q(x)所指定的策略消除系统的不确定性所需要付出的努力的大小。其公式为：
$H(p, q) = \sum_{i=1}^N p_i log_2^{\frac{1}{q_i}}$

KL散度用来衡量两个分布的距离，也称为相对熵:
$KL(p||q) = H(p, q) - H(p)$
，由于 $P$ 代表数据真实分布，是固定的量，所以优化交叉熵等同于优化KL散度。

二、GAN loss理解

从这个角度理解GAN loss：假如判别器为D，真实数据为x，生成数据为 $\hat{x}$ 。则经过判别器后真实数据和生成数据的概率分布分别为 $P(real, fake) \sim (D(x), 1-D(x))$ 和 $\hat{P}(real, fake) \sim (D(\hat{x}), 1-D(\hat{x}))$ 。为了简洁起见，省略了sigmoid函数σ(x)

对于Dloss：生成数据的真实分布为 $P(real, fake) \sim(0, 1)$ ，真实数据的真实分布为 $P(real, fake) \sim(1, 0)$ 。故生成数据和真实数据的损失分别为：

$D_{loss\_real} = 1 * log\frac{1}{D(x)} + 0 * log\frac{1}{1-D(x)} = -log(D(x))$
$D_{loss\_fake} = 0 * log\frac{1}{D(\hat{x})} + 1 * log\frac{1}{(1-D(\hat{x}))} = -log(1-D(\hat{x}))$
$D_{loss} = \frac{D_{loss\_real} + D_{loss\_fake}}{2}$

对于Gloss：认为生成数据如果离真实数据很远就要给与更大惩罚，故此时生成数据的目标分布可以看做 $P(real, fake) \sim(1, 0)$ 。则生成器的对抗损失为：

$G\_{loss}=1 * log\frac{1}{D(\hat{x})} +0 * log\frac{1}{1-D(\hat{x})}=-log(D(\hat{x}))$

三、GAN loss与softplus关系

进一步简化——使用softplus
$softplus(x):= log(1 + e^{x})$
俗称log_sum_exp函数。

$D_{loss\_real} = -log(σ(D(x))) = -log(\frac{1}{1+e^{-D(x)}}) = log(1+e^{-D(x)}) = softplus(-D(x))$
$D_{loss\_fake} = -log(1-σ(D(\hat{x}))) = -log(1-\frac{1}{1+e^{-D(\hat{x})}}) = -log(\frac{e^{-D(\hat{x})}}{1+e^{-D(\hat{x})}}) = -log(\frac{1}{e^{D(\hat{x})}+1}) = log(1+e^{D(\hat{x})}) = softplus(D(\hat{x}))$
同理
$G_{loss} = -log(σ(D(\hat{x}))) = -log(\frac{1}{1+e^{-D(\hat{x})}}) = log(1+e^{-D(\hat{x})}) = softplus(-D(\hat{x}))$

这就解释了一些GAN loss代码里面的写法：

另外，有些图像修补论文中会对mask内、外区域设置不同的判别器目标，如下面这段代码，对于fake样本，mask内部区域的label设置为False，外部设置为True。

交叉熵、GAN loss与softplus
一、交叉熵理解：交叉熵，其用来衡量在给定的真实分布P(x)下，使用非真实分布Q(x)所指定的策略消除系统的不确定...
多分类问题的交叉熵计算
多分类问题的交叉熵在多分类问题中，损失函数（loss function）为交叉熵（cross entropy...
【论文学习】《Dice Loss for Data-imbala
主要内容：文章提出用 Dice Loss 替代交叉熵(standard cross-entropy loss)...
交叉熵损失函数原理详解
交叉熵损失函数原理详解之前在代码中经常看见交叉熵损失函数(CrossEntropy Loss)，只知道它是分类问...
20180711记录
BCE Loss binary_cross_entropy（二进制交叉熵）损失，即用于衡量原图与生成图片...
简单的交叉熵损失函数，你真的懂了吗？
说起交叉熵损失函数「Cross Entropy Loss」，脑海中立马浮现出它的公式：我们已经对这个交叉熵函数非...
交叉熵损失函数
转自简单的交叉熵损失函数，你真的懂了吗？说起交叉熵损失函数「Cross Entropy Loss」，脑海中立马浮现...
Sklearn中二分类问题的交叉熵计算
二分类问题的交叉熵在二分类问题中，损失函数（loss function）为交叉熵（cross entropy...
机器学习值softmax
softmax这个函数用于多分类任务，在我们使用中经常和交叉熵联合起来，至于交叉熵计算loss，以后看到了会写， ...
人工智能实践：Tensorflow笔记2
1 损失函数 loss 均方误差 mse交叉熵 ce Cross Entropysoftmax（） 2学习率 ...

交叉熵、GAN loss与softplus

一、交叉熵理解：

二、GAN loss理解

三、GAN loss与softplus关系

相关文章

交叉熵、GAN loss与softplus

多分类问题的交叉熵计算

【论文学习】《Dice Loss for Data-imbala

交叉熵损失函数原理详解

20180711记录

简单的交叉熵损失函数，你真的懂了吗？

交叉熵损失函数

Sklearn中二分类问题的交叉熵计算

机器学习值softmax

人工智能实践：Tensorflow笔记2

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读