"); //-->
论文地址:
https://openaccess.thecvf.com/content/CVPR2022/papers/Han_Few-Shot_Object_Detection_With_Fully_Cross-Transformer_CVPR_2022_paper.pdf
01
概述
02
背景
03
新框架
Task Definition
在小样本目标检测(FSOD)中,有两组类C=Cbase∪Cnovel和Cbase∩Cnovel=∅,其中基类Cbase每个类都有大量训练数据,而新类Cnovel(也称为支持类)只有每个类的训练示例很少(也称为支持图像)。对于K-shot(例如,K=1,5,10)目标检测,研究者为每个新类别c∈Cnovel准确地使用K个边界框注释作为训练数据。FSOD的目标是利用数据丰富的基类来协助检测少样本的新类。
Overview of Our Proposed Model (FCT)
研究者认为以往的two-branch方法只关注了detection head部分的特征交互,忽略了特征提取部分;于是这篇论文的motivation就出来了。因此研究者在Faster RCNN上提出了Fully Cross-Transformer(FCT)的小样本检测方法,在每个阶段都进行特征交互。如下图所示:
The Cross-Transformer Feature Backbone
在cross-transformer中计算Q-K-V attention时为了减少计算量,研究者采用了PVTv2的方式。上面大致介绍了query和support特征提取,在特征交互上作者提出了 Asymmetric-Batched Cross-Attention。具体做法如下图和公式所示:
评论。研究者彻底研究了提出的模型中两个视觉分支之间的多层次交互。cross-transformer特征主干中的三个阶段使两个分支与低级、中级和高级视觉特征逐渐有效交互。
The Cross-Transformer Detection Head
在detection head部分,和以上操作相反,在每张query上提取完proposal之后经过ROI Align可以得到ROI特征fp∈RBp∗H′∗W′∗C3,其中Bp=100,为了减少计算复杂度还是对support进行ave操作fs′=1Bs∑Bsfs,fs′∈R1∗H′∗W′∗C3,然后使用Asymmetric-Batched Cross-Attention计算俩分支attention,不同的是,query分支Bp≥1 and Bs′=1 。
04
实验
从上面表格的(c-d)俩行可以看出,使用三阶段训练在2-shot、10-shot上均有提升。
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
释说芯语16:硬科技:构建企业未来之路(附PPT)
WTC-AI型太阳能热水器电路图
CSR8670CSR8675智能语音Alexa蓝牙方案开发
PowiGaN for AI Data Centers: Unmatched Power Density and Reliability
紧凑型集成连接器模块抑制噪声 为人工智能应用实现以太网供电
继上次海联达Ai-ap100拆机之电源改造
万家乐JSYZ5-AI燃气热水器电路图
iCAN-4017 AI功能模块
EEPW2018年3月刊(工业物联网)
瑞萨电子AI单元解决方案成功提高GE医疗(日本)日野工厂的生产力
WTC-AI太阳能热水器电路图
AI 驱动估值飙升:光通信半导体企业市值暴涨
基于Microchip MCU的AI/ML培训教程3
AI热潮引发多层陶瓷电容MLCC供应短缺
爱立信携手 Net Feasa 布局海事网络 融合公网级通信与智能体 AI 赋能航运
赋能边缘端对话式人工智能
基于VisitionX制造智能眼镜
研华 COMPUTEX 首度整合全球伙伴大会 强化全球边缘 AI 生态系统联结
英伟达CFO:我们早就知道内存大涨价要来了
EEPW2018年6月刊(5G)
基于Ai-WB2-12F与Rd-04的雷达检测系统
尼吉康的事业介绍
电子元件培训教材
GPU:面临工作负载转变的高吞吐架构
海联达(Aigale)Ai-HD1 无线全高清套件拆解
Nigel AI赋能LabVIEW,NI用AI重塑测试新边界
基于Microchip MCU的AI/ML培训教程2
人工智能是如何帮助阻止造假者的?
AI竞争进入下半场:从“卷参数”到“卷单价”
基于Microchip MCU的AI/ML培训教程1