专栏中心

EEPW首页 > 专栏 > 目标检测 | Anchor free的目标检测进阶版本

目标检测 | Anchor free的目标检测进阶版本

发布人：CV研究院时间：2021-04-19 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

今天说的是《Soft Anchor-Point Object Detection》，其也是最近关于anchor free的目标检测的论文，作者来自于CMU，一作同样也是FSAF（2019 CVPR）的作者。该论文的出发点还是在样本选择和FPN特征选择层面。

背景

Anchor free是目标检测领域的一个研究热点，其主要可以分为anchor-point和keypoint两类。后者在往往在一个高分辨率的特征图上进行检测，其优点是准确率高，但是计算量大。而anchor-point的方法往往在多个分辨率上进行检测，结构简单，速度更快。作者认为anchor-point的方法性能不高主要还是在于训练的不充分，主要是注意力偏差（attention bias）和特征选择（feature selection）。因而作者提出了两种策略：1）soft-weighted anchor points对不同位置的样本进行权重分配，2）soft-selected pyramid levels，将样本分配到多个分辨率，并进行权重加权。

方法框架

整体框架其实和FSAF是类似

●Soft-Weighted Anchor Points ●

清晰的目标更容易获得关注和更高的分数，而边缘或者被遮挡的目标比较难检测。具体的问题如下：

上图中有五个足球运动员，分类输出的得分图score map如图b所示，可以看到有两个运动员的得分区域占了主导地位。甚至这两个运动员的得分区域还侵占了其他运动员的得分区域。

作者认为引起该问题的主要原因是特征不对齐，位于gt边缘的anchor和位于中心的anchor不应被同等对待。解决思路就是对不同位置的样本引入不同的权重，其离gt的中心越近，其权重越高，离gt中心越远，其权重越低（因为边缘往往意味着包含很多背景信息）。从而引入了广义

概述我们的训练策略与h soft-weighted anchorpoints和soft-selected pyramid levels。黑条表示正锚定点对网络损耗贡献的指定权重。

●Soft-Selected Pyramid Levels ●

该问题实际上在FSAF中也研究过，即如何选择合适的分辨率（尺度）来进行目标的检测。FSAF是通过loss来选择合适的分辨率。该论文同时也借鉴了FoveaBox将一个anchor映射到多个分辨率进行检测的思想（实际上工程中也会用到）来提升性能。同时作者还给不同的分辨率分配不同的权重。具体地，作者额外训练了一个子网络来预测不同尺度的权重，该网络具体为：

而该子网络的输入，是在不同分辨率上利用roialign提取gt（ground truth）的特征，并

实验结果

作者和FSAF（基于anchor-free分支）进行比较，soft-weighted anchor points（SW）策略提升了1.1个点，soft-selected pyramid levels（SS）提升了1个点。作者还采用了BFPN（2019 CVPR Libra RCNN中的特征融合策略）进行了加强，还能有性能提升。

可视化结果

论文最好的性能是47.4，在R50上也达到了41.7。

总结

作者在FSAF的基础上进一步地分析了现有的两个问题：注意力偏差和特征选择问题。前一个问题通过对不同样本加权实现，后一个问题通过对不同分辨率加权实现，论文讲述清晰，思路简单。同时也要注意到，该论文特征选择预测网络的训练问题，工程上是否真的有效还需进一步地尝试验证。

论文地址：https://arxiv.org/pdf/1911.12448.pdf

专栏文章内容及配图由作者撰写发布，仅供工程师学习之用，如有侵权或者其他违规问题，请联系本站处理。联系我们

关键词： 深度学习

更多焦点

更多视频

专栏中心

目标检测 | Anchor free的目标检测进阶版本

相关推荐

人工智能深度学习目标检测的详细技巧资料免费下载

MCX N系列NPU智能驱动AI咖啡机，重塑咖啡研磨新境界！

基于深度学习的智能电网短期日负荷曲线预测系统设计与实现

深度学习实际上是如何工作的？

深度学习（DeepLearning）

python机器学习和深度学习的学习书籍资料免费下载

人工智能之深度学习模型的对抗攻击及防御措施学习实例教程

Firefly DL小巧轻便，嵌入式深度学习加速部署

一文读懂｜什么是机器学习

一文总结：人工智能、机器学习、深度学习的关键技术概念及 Edge AI 的行业发展前景

深度学习（人工神经网络的研究的概念）

Deep Learning中文版

更安全的自动驾驶车辆意味着要向他们提出正确的问题

TFLite模型的开盲盒体验

AI深度学习

人工智能促进科研职业发展，但抑制科学发现

射频系统的深度学习

用AI协助儿童听力检测以深度学习姿势识别技术提升准确性

什么是人机交互技术？

深度强化学习核心技术开发与应用

技术专区