深度学习经典检测方法

   one-stage:其直接为物体生成分类概率和位置坐标值,无需区域建议阶段。 检测速度更快,因为一次检测就可以直接得到最终的检测结果。代表:yolo系列,SSD系列等。

   two-stage:其首先生成一个region proposal,然后使用卷积神经网络对候选区域进行分类。代表:Rcnn、Fast Rcnn、Faster RcnnMask Rcnn系列。

两者区别:

       例:如果你想找到这幅图像的猫,one-stage仅用一个cn网络(求出x1,y1,x2,y2坐标)就可以得到你想要的结果

                 

       而two-stage中,同样也是要检测出猫猫,但其多加了一个RPN:(RegionProposal Network区域建议网络),意思就是在得到最终结果前,先进行一次预选,宝苦熬它的分类及位置修正,然后得出结果。

                     

两者的优缺点:

     one-stage:1.速度非常快,适合做实时检测任务 2.缺点就是效果通常情况下不会太好

     two-stage:2.速度通常较慢,但是效果通常还可以 

物体检测的指标分析

IOU

         IOU(Intersection over Union):交集和并集的比值,是一种测量在特定数据集中检测相应物体准确值的一个标准。IOU是一个简单的测量标准,只要是在输出中得出一个预测范围(bounding boxes)的任务都可以用IOU来进行测量。在目标检测中是产生的候选率(candidate bound)与原标记框(ground truth bound)的交叠率,即它们的交集与并集的比值。最理想情况是完全重叠,即比值为1。

                                         

       因此可以看出,如果检测效果越理想,预测框和真实框的交集应该大,而且并集应该接近于他们本身。

mAP

        mAPmean Average Precision:综合衡量检测效果,因为精度和召回率在机器学习中是反向关系,所以单看一个指标很难判断出它的实际情况,所以用mAP来表示检测效果

     那什么是精度和召回率呢?1.精度:预测为正例的那些数据里预测正确的数据个数 2.召回率(查全率)(recall):真实为正例的那些数据里预测正确的数据个数

                                                 

       那么TP、FP、FN、TN又是什么意思呢?

       举个栗子,假设我们手上有60个正样本,40个负样本,我们要找出所有的正样本,系统查找出50个,其中只有40个是真正的正样本,计算上述各指标。

       1True positive(TP): 真正例,将正类正确预测为正类数;

       2False positive(FP): 假正例,将负类错误预测为正类数;

       3False negative(FN):假负例,将正类错误预测为负类数;

       4True negative(TN): 真负例,将负类正确预测为负类数

因此

  • TP: 将正类预测为正类数=40
  • FN: 将正类预测为负类数=20
  • FP: 将负类预测为正类数=10
  • TN: 将负类预测为负类数=30

     基于置信度阈值来计算,例如分别计算0.9; 0.8;0.7,设置阈值是出现的预测框不止一个,给出一个范围,保留置信度高的预测框,在下图中置信度表示识别人脸的概率

                                                 

     在上图中,如果阈值为0.9,则tp=1(第一张图),fp=0(因为阈值是0.9,所以第二幅图和第三幅图的预测框就去掉了)。所以tp+fp=1,所以precision=1。fn=2(第二张图和第三张图的脸因为阈值关系所以并没有检测到,所以fn=2),所以recall=1/3

                                                                                           

    由给出的图表可以发现,精度高时召回率通常低,反之亦然,因此我们一般采用综合衡量检测效果,也就是前面提到的mAP。所以AP,average precision,就是这个曲线下的面积,这里average,等于是对recall取平均。而mean average precision的mean,是对所有类别取平均(每一个类当做一次二分类任务)。现在的图像分类论文基本都是用mAP作为标准。