美文网首页
深度学习基础理论_论文学习_Optimal Transport

深度学习基础理论_论文学习_Optimal Transport

作者: 欠我的都给我吐出来 | 来源:发表于2021-10-09 18:38 被阅读0次

    将类别分配策略看成是最低代价的路径分配问题,使得标签分类更具有全局性;会提高训练的时间,但是对于推理的时间没有变换。

    当前基于卷积神经网络的目标检测器是通过预测一组预定义锚点的分类标签进行目标检测。经典的分配策略可以归结为两种:静态分配策略和动态分配策略。

    静态分配策略通常采用预定义的规则来分配每个锚点所处的目标对象或背景,这种静态策略会存在一个问题,对于具有不同大小、形状或遮挡条件的目标对象划分边界应该有所不同,但是静态分配却采用了相同的策略,这不合理。

    动态分配策略中每个锚点的预测置信度是一个动态分配的指标,高置信度的锚点可以容易地被网络学习,从而被分配给相关的目标对象,但是动态分配策略依然会有因为不能利用全局信息而会导致锚点分配模糊的问题。

    一个更好的分配策略应该是摆脱传统的为每一个目标对象单独寻求最优分配的做法,由此启发,作者转向全局最优的思想,并将最优传输理论应用到目标检测中的标签分类问题中,目的是为图像中的所有目标找到全局高置信度分配方式。作者首先将目标检测的标签分配问题表述为一个最优运输问题,然后将求解最优传输问题转化为求解最优运输方案,进而可以利用现成的Sinkhorn-Knopp迭代快速高效地求解。

    image.jpeg image.jpeg

    将标签分配的策略看作是最优化路径的问题。

    将GT看成是提供者,将anchors看成是消费者,需求者。提供者提供一定护数量的标签,如果一个需求者从一个提供者GT上获得足够多数量的标签,那么这个anchor就是这个GT的正例。

    从这个语义上,每个GT提供的标签数量可以被理解为“”GT需要多少正例才能在训练过程中更好的收敛“

    每对anchor-GT单位路径开销都可以被定义为分类损失和回归损失的权重之和。

    背景background是负例;因此也会提供负标签。背景和对应的anchor的路径开销被定义为分类损失。

    相关文章

      网友评论

          本文标题:深度学习基础理论_论文学习_Optimal Transport

          本文链接:https://www.haomeiwen.com/subject/snaqoltx.html