一、IoU,GIoU
1.1 IoU(intersection over union,交并比)
在目标检测算法中,我们经常需要评价2个矩形框之间的相似性,直观来看可以通过比较2个框的距离、重叠面积等计算得到相似性,而IoU指标恰好可以实现这样的度量。简而言之,IoU是目标检测算法中用来评价2个矩形框之间相似度的指标。
IoU = 两个矩形框相交的面积 / 两个矩形框相并的面积,如下图所示:
优点:
(1)可以反映预测检测框与真实检测框的检测效果。
(2)尺度不变性,也就是对尺度不敏感(scale invariant), 在regression任务中,判断predict box和gt的距离最直接的指标就是IoU。(满足非负性;同一性;对称性;三角不等性)
作为损失函数会出现的问题(缺点):
(1)如果两个框没有相交,根据定义,IoU=0,不能反映两者的距离大小(重合度)。同时因为loss=0,没有梯度回传,无法进行学习训练。 (2)IoU无法精确的反映两者的重合度大小。如下图所示,三种情况IoU都相等,但看得出来他们的重合度是不一样的,左边的图回归的效果最好,右边的最差。
1.2 GIoU
\[GIoU = IoU - \frac{|A_c-U|}{|A_c|}\]上面公式的意思是:先计算两个框的最小闭包区域面积$A_c$(通俗理解:同时包含了预测框和真实框的最小框的面积),再计算出IoU,再计算闭包区域中不属于两个框的区域占闭包区域的比重,最后用IoU减去这个比重得到GIoU。
与IoU只关注重叠区域不同,GIoU不仅关注重叠区域,还关注其他的非重合区域,能更好的反映两者的重合度。二、TP, FP, TN, FN, Precision, Recall
2.1 TP, FP, TN, FN
TP、TN、FP、FN即true positive, true negative, false positive, false negative的缩写,positive和negative表示的是你预测得到的结果,预测为正类则为positive,预测为负类则为negative; true和false则表示你预测的结果和真实结果是否相同,相同则是true,不同则为false,如下图:
TP: are the Bounding Boxes (BB) that the intersection over union (IoU) with the ground truth (GT) is above 0.5 FP: two cases (a) BB that the IoU with GT is below 0.5 (b) the BB that have IoU with a GT that has already been detected. TN: there are not true negative, the image are expected to contain at least one object FN: those images were the method failed to produce a BB
2.2 Precision
\(Precision = \frac{TP}{TP+FP}\) Precision 即为你所预测为正类的图片中也的确是正类的概率。
2.3 Recall
\(Recall = \frac{TP}{TP+FN}\) Recall 指原始为正类图片中判别正确的概率。
非极大值
Reference
(一) IoU, GIoU
https://zhuanlan.zhihu.com/p/94799295
(二) TP, FP,
如果你觉得本文对你有帮助,不妨请我喝杯咖啡