目标检测基础概念总结 返回首页

发表于 2020-06-18 | 本文共 177 字

一、IoU,GIoU

1.1 IoU(intersection over union,交并比)

在目标检测算法中,我们经常需要评价2个矩形框之间的相似性,直观来看可以通过比较2个框的距离、重叠面积等计算得到相似性,而IoU指标恰好可以实现这样的度量。简而言之,IoU是目标检测算法中用来评价2个矩形框之间相似度的指标。

IoU = 两个矩形框相交的面积 / 两个矩形框相并的面积,如下图所示:

图1.IoU示意图

优点:

(1)可以反映预测检测框与真实检测框的检测效果。

(2)尺度不变性,也就是对尺度不敏感(scale invariant), 在regression任务中,判断predict box和gt的距离最直接的指标就是IoU。(满足非负性;同一性;对称性;三角不等性)

作为损失函数会出现的问题(缺点):

(1)如果两个框没有相交,根据定义,IoU=0,不能反映两者的距离大小(重合度)。同时因为loss=0,没有梯度回传,无法进行学习训练。 (2)IoU无法精确的反映两者的重合度大小。如下图所示,三种情况IoU都相等,但看得出来他们的重合度是不一样的,左边的图回归的效果最好,右边的最差。

图2.IoU无法精确的反映两者的重合度大小

1.2 GIoU

\[GIoU = IoU - \frac{|A_c-U|}{|A_c|}\]

上面公式的意思是:先计算两个框的最小闭包区域面积$A_c$(通俗理解:同时包含了预测框和真实框的最小框的面积),再计算出IoU,再计算闭包区域中不属于两个框的区域占闭包区域的比重,最后用IoU减去这个比重得到GIoU。

与IoU只关注重叠区域不同,GIoU不仅关注重叠区域,还关注其他的非重合区域,能更好的反映两者的重合度。

二、TP, FP, TN, FN, Precision, Recall

2.1 TP, FP, TN, FN

TP、TN、FP、FN即true positive, true negative, false positive, false negative的缩写,positive和negative表示的是你预测得到的结果,预测为正类则为positive,预测为负类则为negative; true和false则表示你预测的结果和真实结果是否相同,相同则是true,不同则为false,如下图:

图3.指定类别的混淆矩阵

TP: are the Bounding Boxes (BB) that the intersection over union (IoU) with the ground truth (GT) is above 0.5 FP: two cases (a) BB that the IoU with GT is below 0.5 (b) the BB that have IoU with a GT that has already been detected. TN: there are not true negative, the image are expected to contain at least one object FN: those images were the method failed to produce a BB

2.2 Precision

\(Precision = \frac{TP}{TP+FP}\) Precision 即为你所预测为正类的图片中也的确是正类的概率。

2.3 Recall

\(Recall = \frac{TP}{TP+FN}\) Recall 指原始为正类图片中判别正确的概率。

非极大值

Reference

(一) IoU, GIoU

https://zhuanlan.zhihu.com/p/94799295

(二) TP, FP,


如果你觉得本文对你有帮助,不妨请我喝杯咖啡


显示评论