"); //-->
DETR是第一个使用transformer编码器-****架构的端到端对象检测器,在高分辨率特征图上展示了具有竞争力的性能但计算效率低。
01 前言
DETR是第一个使用transformer编码器-****架构的端到端对象检测器,在高分辨率特征图上展示了具有竞争力的性能但计算效率低。随后的工作Deformable DETR通过将密集注意力替换为可变形注意力来提高DETR的效率,从而实现了10倍的收敛速度和性能提升。

DETR
Deformable DETR使用多尺度特征来改善性能,然而,与DETR相比,encoder token的数量增加了20倍,并且编码器注意力的计算成本仍然是瓶颈。在我们的初步实验中,我们观察到即使只更新了一部分encoder token,检测性能也几乎不会恶化。受此观察的启发,研究者提出了稀疏DETR,它选择性地仅更新预期被****引用的标记,从而帮助模型有效地检测目标。
图片
此外,研究者展示了在编码器中对所选标记应用辅助检测损失可以提高性能,同时最大限度地减少计算开销。我们验证了即使在COCO数据集上只有10%的encoder token,Sparse DETR也比可变形DETR实现了更好的性能。尽管只有encoder token被稀疏化,但与可变形DETR相比,总计算成本降低了38%,每秒帧数 (FPS) 增加了42%。
02背景
近年来,我们见证了深度学习中目标检测的巨大进步和成功。已经提出了多种目标检测方法,但现有算法将与GT进行正匹配作为一种启发式方法,需要对近似重复预测进行非极大值抑制 (NMS) 后处理。最近Carion等人通过基于集合的目标消除了对NMS后处理的需要,引入了完全端到端的检测器DETR。训练目标采用匈牙利算法设计,既考虑分类成本,又考虑回归成本,并获得极具竞争力的性能。但是,DETR无法使用多尺度特征,例如特征金字塔网络,这些特征常用于目标检测,以提高对小目标的检测。主要原因是通过添加Transformer 架构增加了内存使用和计算。因此,它对小物体的检测能力比较差。
为了解决这个问题,有人提出了一种受可变形卷积 (deformable convolution) 启发的可变形注意力,并通过注意力模块中的关键稀疏化将二次复杂度降低为线性复杂度。通过使用可变形注意力,可变形DETR解决了DETR收敛速度慢和复杂度高的问题,使编码器能够使用多尺度特征作为输入,显着提高了检测小物体的性能。然而,使用多尺度特征作为编码器输入会使要处理的token量增加约20倍。最终,尽管对相同的token长度进行了有效的计算,但整体复杂性再次增加,使得模型推理甚至比普通的DETR更慢。
03 新框架分析

(a) DETR中的密集注意力需要二次复杂度。(b) Deformable DETR使用密钥稀疏化,因此具有线性复杂度。(c) Sparse DETR进一步使用查询稀疏化。Sparse DETR中的Attention也采用线性复杂度,但比Deformable DETR轻得多。

上图说明了如何通过预测二值化****交叉注意力图(DAM)来学习评分网络,其中橙色虚线箭头表示反向传播路径。左边部分展示了编码器中的前向/反向传播,右边部分展示了如何构建DAM来学习评分网络。

稀疏DETR引入了三个附加组件:(a)评分网络,(b)编码器中的辅助头,以及(c)为****选择前k个token的辅助头。稀疏DETR使用评分网络测量编码器token的显着性,并选择top-ρ%的token,在上图中称为(1)。在仅精炼编码器块中选定的token后,辅助头从编码器输出中选择前k个token,用作****对象查询。这个过程在上图中被称为(2)。此外,我们注意到每个编码器块中的附加辅助磁头在提高性能方面发挥着关键作用。仅将稀疏编码器token传递给编码器辅助头以提高效率。编码器和****中的所有辅助头都经过Hungarian损失训练,如Deformable DETR中所述。
04实验及可视化


专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
EEPW2018年6月刊(5G)
国家“算力网”:像用水用电一样用AI
AI/HPC新世代 COUPE光互连扮要角
瑞萨电子AI单元解决方案成功提高GE医疗(日本)日野工厂的生产力
释说芯语16:硬科技:构建企业未来之路(附PPT)
存储器转型AI战略资源 台厂受惠
被动元件新周期:AI时代高端化、服务器化重构MLCC产业格局
研华科技与Axelera AI深化战略合作 加速推动基于Europa平台的边缘AI创新
电子元件培训教材
基于Ai-WB2-12F与Rd-04的雷达检测系统
联发科加速AI在地化应用布局
思科凭借通用商用芯片与光模块赢得 AI 领域客户
尼吉康的事业介绍
基于Microchip MCU的AI/ML培训教程1
基于Microchip MCU的AI/ML培训教程2
iCAN-4017 AI功能模块
PowiGaN for AI Data Centers: Unmatched Power Density and Reliability
CSR8670CSR8675智能语音Alexa蓝牙方案开发
海联达(Aigale)Ai-HD1 无线全高清套件拆解
AI聊天机器人能像医生一样推理吗?
AI催生“芯片通胀”:2D NAND价格失控,300%涨幅背后的行业博弈
基于VisitionX制造智能眼镜
继上次海联达Ai-ap100拆机之电源改造
WTC-AI太阳能热水器电路图
人工智能是如何帮助阻止造假者的?
基于Microchip MCU的AI/ML培训教程3
EEPW2018年3月刊(工业物联网)
重新构想AI电源:塑造AI加速的未来(第三部分)
万家乐JSYZ5-AI燃气热水器电路图
WTC-AI型太阳能热水器电路图