目标检测的定位回归损失为Smooth L1损失
但是这种loss假设4个点独立,但是实际上边框的4个点之间是有联系的,而且实际评价框检测的指标是使用IOU,这两者是不等价的,多个检测框可能有相同大小的loss,但是IoU可能差异很大。
IoU loss——旷视(2016)
通过4个坐标点独立回归的缺点:
1.检测评价的方式是使用IoU,而实际回归坐标框的时候是使用4个坐标点,不等价,L1或者L2 Loss相同的框,其IoU 不是唯一的
2.通过4个点回归坐标框的方式是假设4个坐标点是相互独立的,没有考虑其相关性,实际4个坐标点具有一定的相关性
3.基于L1和L2的距离的loss对于尺度不具有不变性

GIoU Loss——CVPR 2019
IoU Loss的两个缺点:
当预测框和目标框不相交时,IoU(A,B)=0时,不能反映A,B距离的远近,此时损失函数不可导,IoU Loss 无法优化两个框不相交的情况。
假设预测框和目标框的大小都确定,只要两个框的相交值是确定的,其IoU值是相同时,IoU值不能反映两个框是如何相交的。

C是A,B的最小外接矩形,用C减去A和B的并集除以C得到一个数值,然后再用框A和B的IoU减去这个数值即可得到GIoU的值。

当A,B不相交时,GIoU(A,B)=-1
DIoU Loss(CIoU Loss)——AAAI 2020
当目标框完全包裹预测框的时候,IoU和GIoU的值都一样,此时GIoU退化为IoU, 无法区分其相对位置关系;此时作者提出的DIoU因为加入了中心点归一化距离,所以可以更好地优化此类问题。
直接最小化预测框与目标框之间的归一化距离以达到更快的收敛速度:
DIoU loss考虑重叠面积和中心点距离,但没考虑长宽比:

最后一项为惩罚项,
DIoU具有尺度不变性,当两个框重合时,IoU Loss,DIoU Loss,GIoU Loss都等于零,当两个框不相交时,GIoU Loss = DIoU Loss趋于2
DIoU Loss可以直接优化2个框直接的距离,比GIoU Loss收敛速度更快
对于目标框包裹预测框的这种情况,DIoU Loss可以收敛的很快,而GIoU Loss此时退化为IoU Loss收敛速度较慢
CIoU Loss
CIoU的惩罚项是在DIoU的惩罚项基础上加了一个影响因子,这个因子把预测框长宽比拟合目标框的长宽比考虑进去:



CIoU Loss的定义:

网友评论