双尺度残差检测器：无先验检测框进行目标检测

发布人：CV研究院时间：2021-11-10 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

论文地址：https://arxiv.org/pdf/1904.06883.pdf

Dubox增强了启发式引导的能力，进一步使第一尺度探测器能够最大限度地检测小目标，第二尺度探测器能够检测第一尺度探测器无法识别的目标。今天给大家分享的文章可能会优点旧，但是我觉得整体是一个不错的ideal！

一、背景

长期以来，目标检测一直是计算机视觉领域的一个具有挑战性的问题。随着深度神经网络（DNN）的发展，近年来在目标检测方面取得了重大进展。它是各种工业应用的先决条件，例如自动驾驶和面部分析。由于深度卷积神经网络和标注良好的数据集的进步，目标检测器的性能得到了显着提高。

现实世界中的图像包含不同比例的对象。尺度变化已成为目标检测领域的一个具有挑战性的问题。为了实现尺度不变性，最先进的方法通常结合多个层次的特征来构建特征金字塔或多层特征塔。同时，为了提高检测性能，多尺度方法在不同尺度上并行使用多个检测器。例如，RetinaNet有五个尺度检测器（p3-p7），它们在特征金字塔结构上并行检测。YOLOv5在主网上运行了三个检测器。

此外，prior box被认为是处理尺度不变性的有效手段。它是许多检测器的基础，例如Faster RCNN和YOLOv2中的锚点，SSD中的默认框。先验框是一堆具有预定义大小和纵横比的框，它们以滑动窗口的方式平铺特征图，作为检测候选。先验框离散化可能的输出边界框形状的空间，DNN基于特定的先验框利用先验信息对边界框进行回归。多尺度检测和先验框的混合是最先进的检测器中的常见做法，它利用了多尺度特征和预先计算的边界框统计数据。

二、前言

传统的目标检测方法使用多尺度特征，允许多个检测器独立并行地执行检测任务。同时，通过对prior box的处理，增强了算法处理尺度不变性的能力。然而，太多的先验框和独立的检测器会增加检测算法的计算冗余。

Some comparisons with the precision and speed to clas- sical algorithms on VOC07, ▽ is two-stage method， ⃝ denote the one-stage algorithm, □is Dubox.

今天这项研究中，研究者介绍了Dubox，这是一种新的单阶段方法，可以在没有先验框的情况下检测目标。使用多尺度特征，设计的双尺度残差单元使双尺度检测器不再独立运行。第二个尺度检测器学习第一个的残差。Dubox增强了启发式引导的能力，可以进一步使第一尺度检测器能够最大限度地检测小目标，第二尺度检测器能够检测第一个无法识别的对象。此外，对于每个尺度检测器，新的classification-regression progressive strap loss（CRPS）使整个的过程不再基于先验框。整合这些策略，新提出的检测算法在速度和准确性方面取得了出色的表现。在VOC、COCO目标检测基准上的大量实验证实了该算法的有效性。

三、新框架