Pytorch交叉熵损失函数CrossEntropyLoss报错

作者: 一位学有余力的同学 | 来源:发表于2020-01-02 17:13 被阅读0次

Pytorch交叉熵损失函数CrossEntropyLoss报错
pytorch【损失函数模块】一、损失函数之一
pytorch 损失函数及其应用代码详解
pytorch 交叉熵损失教程(1)-torch.nn.Cros
损失函数 - 交叉熵损失函数
交叉熵损失函数原理详解
利用神经网进行西瓜分类（上）
交叉熵损失函数
语义分割损失函数
理解熵，交叉熵和交叉熵损失

第一次用的损失函数是均方误差MSELoss程序正常运行没有遇到问题，但当换成CrossEntropyLoss后会报如下错误：

RuntimeError: Expected object of scalar type Long but got scalar type Float for argument #2 'target' in call to _thnn_nll_loss_forward

搜了很多博客都没有找到答案，这篇博客中说到：
交叉熵需要传入一个output和一个target。nn.CrossEntropyLoss(output, target)。
其中：

output.dtype : torch.FloatTorch
target.dtype : torch.LongTorch

我的预测数据output和标签数据target都是torch.float32数据类型，所以我在将array数据类型转换成tensor数据类型时做了如下操作：

x = torch.from_numpy(x).float()
target = torch.from_numpy(target).long()

其中float是float32类型，long是int64类型，但是问题依然存在。

在pytorch的官方论坛里有一个人也遇到了同样的问题，他把nn.CrossEntropyLoss()换成了nn.MultiLabelSoftMarginLoss()就不再报错了。但是经过实验发现，这个损失函数的效果非常差，远不如MSELoss。

最终，我找到了一篇运用交叉熵损失函数的多分类代码一步步检查发现了报错的原因:

在多分类问题中，当损失函数为nn.CrossEntropyLoss()时，它会自动把标签转换成onehot形式。例如，MNIST数据集的标签为0到9的数字，有100个标签，则标签的形状为[100]，而我们的模型的输出则为onehot形式，其形状为[100, 10]。所以，我们在运用交叉熵损失函数时不必将标签也转换成onehot形式。问题成功解决。（target仍然需要为int64类型）

网友评论

本文标题：Pytorch交叉熵损失函数CrossEntropyLoss报错

本文链接：https://www.haomeiwen.com/subject/iqlnoctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Pytorch交叉熵损失函数CrossEntropyLoss报错

相关文章