专栏中心

EEPW首页 > 专栏 > 目标检测新框架:大幅度提升检测精度(附源代码下载)

目标检测新框架:大幅度提升检测精度(附源代码下载)

发布人:CV研究院 时间:2021-10-08 来源:工程师 发布文章

目标检测中,点特征使用方便,但可能缺乏精确定位的明确边界信息。 

1.png

1 简述

密集物体检测器依赖于滑动窗口范式,可以在规则的图像网格上预测物体。同时,采用网格点上的特征图来生成边界框预测。点特征使用方便,但可能缺乏精确定位的明确边界信息。 

在今天分享中,有研究者提出了一种简单高效的算子,称为 Border-Align,从边界的极值点提取“边界特征”以增强点特征。基于BorderAlign,研究者设计了一种称为BorderDet的新型检测架构,它明确利用边界信息进行更强的分类和更准确的定位。

2 背景

2.png

Sliding Window

滑窗法作为一种经典的物体检测方法,个人认为不同大小的窗口在图像上进行滑动时候,进行卷积运算后的结果与已经训练好的分类器判别存在物体的概率。选择性搜索(Selective Search)是主要运用图像分割技术来进行物体检测。

3.png

通过滑窗法流程图可以很清晰理解其主要思路:首先对输入图像进行不同窗口大小的滑窗进行从左往右、从上到下的滑动。每次滑动时候对当前窗口执行分类器(分类器是事先训练好的)。如果当前窗口得到较高的分类概率,则认为检测到了物体。对每个不同窗口大小的滑窗都进行检测后,会得到不同窗口检测到的物体标记,这些窗口大小会存在重复较高的部分,最后采用非极大值抑制(Non-Maximum Suppression, NMS)的方法进行筛选。最终,经过NMS筛选后获得检测到的物体。

3 新框架分析

4.png

滑动窗口目标检测器通常在密集的、规则的特征图网格上生成边界框预测。如上图所示,网格每个点上的特征一般用于预测目标的类别和位置。这种基于点的特征表示很难包含有效的边界特征,并且可能会限制目标检测器的定位能力。对于两阶段目标检测器,目标由从整个边界框中提取的区域特征来描述,如上图(b)所示。这种基于区域的特征表示能够为目标分类和定位提供比基于点的特征表示更丰富的特征。

6.png

在上表中,研究者对边界框的特征表示进行了更深入的分析。首先,采用一个简单的密集目标检测器(FCOS)作为新框架的基线来生成粗边界框预测。

Border Align

7.png

受R-FCN的启发,新框架的BorderAlign以具有(4 + 1)C通道的边界敏感特征图I作为输入。特征图的4C通道对应四个边界(左、上、右、下)。

8.png

border-sensitive特征图可视化

边界上的橙色圆圈表示极值点。'Single Point', 'Left Border', 'Top Border', 'Right Border' 和 'Bottom Border'的特征图是边界敏感特征图的每个 C 通道的最大特征值。

8.png

新方法也可以作为典型的两级检测器的更好的候选生成器。 研究者将边界对齐模块添加到RPN并将新结构表示为BorderRPN。BorderRPN的架构如上图所示。保留RPN中的回归分支来预测粗边界框位置。RPN中的第一个3 × 3卷积被替换为3 × 3空洞卷积以增加有效感受野。

4 实验

9.png

在NVIDIA 2080Ti GPU上的测试结果

10.png

在某种程度上,可证明BorderAlign确实在提取边界极限的特征,且边界极限点的特征对物体的精准定位确实有一些帮助。

11.png

专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: AI

相关推荐

AI热潮引发多层陶瓷电容MLCC供应短缺

基于Microchip MCU的AI/ML培训教程2

视频 2025-11-12

研华 COMPUTEX 首度整合全球伙伴大会 强化全球边缘 AI 生态系统联结

紧凑型集成连接器模块抑制噪声 为人工智能应用实现以太网供电

爱立信携手 Net Feasa 布局海事网络 融合公网级通信与智能体 AI 赋能航运

EEPW2018年6月刊(5G)

资源下载 2018-06-11

PowiGaN for AI Data Centers: Unmatched Power Density and Reliability

视频 2025-12-19

基于Microchip MCU的AI/ML培训教程3

视频 2025-11-12

电子元件培训教材

AI 驱动估值飙升:光通信半导体企业市值暴涨

AI竞争进入下半场:从“卷参数”到“卷单价”

2026-05-22

GPU:面临工作负载转变的高吞吐架构

英伟达CFO:我们早就知道内存大涨价要来了

2026-05-24

尼吉康的事业介绍

视频 2025-07-25

Nigel AI赋能LabVIEW,NI用AI重塑测试新边界

2026-05-22

赋能边缘端对话式人工智能

基于Microchip MCU的AI/ML培训教程1

视频 2025-11-12

EEPW2018年3月刊(工业物联网)

CSR8670CSR8675智能语音Alexa蓝牙方案开发

资源下载 2017-12-14
更多 培训课堂
更多 焦点
更多 视频

技术专区