"); //-->
论文地址:https://arxiv.org/pdf/2207.05501.pdf
一、总概述
NCB 和 NTB 分别使用新颖的部署友好的多头卷积注意力 (MHCA) 和轻量级的高低频信号混合器来增强建模能力。为了进一步提高性能,设计了 Next Hybrid Strategy (NHS),通过在每个阶段以新的混合范式堆叠 NCB 和 NTB,大大降低了 Transformer 块的比例,并在各种下游任务中最大程度地保留了 Vision Transformer 网络的高精度。
与现有的基于 CNN 和 ViT 的方法相比,Next-ViT 在延迟/准确性权衡方面表现出优越的性能。实验结果表明,Next-ViT 在各种下游任务中取得了最先进的结果,包括图像分类、目标检测和语义分割。因此,Next-ViT 是一个强大的模型,可以有效地应用于现实工业场景中的各种计算机视觉任务。
二、动机
由于传统的卷积神经网络(CNN)和Vision Transformer(ViT)在现实的工业场景中存在一些局限性,因此该论文提出了Next-ViT模型。具体来说,传统的CNN在处理长序列时缺乏全局性,而ViT虽然具有全局性,但它们的注意力机制复杂,导致计算量大且效率低下。为了克服这些缺点,Next-ViT引入了Next Convolution Block(NCB)和Next Transformer Block(NTB),并设计了Next Hybrid Strategy(NHS)来提高模型的性能。
Next-ViT遵循分层的金字塔体系结构,在每个阶段都有一个patch embedding层和一系列的卷积或Transformer blocks。该模型使用MHCA(多头卷积注意力)来增强建模能力,通过创新的CNN和Transformer架构方式实现高性能和高效率相结合。Next-ViT在各种计算机视觉任务中取得了最先进的结果,包括图像分类、目标检测和语义分割。因此,Next-ViT是一个强大的模型,可以有效地应用于现实工业场景中的各种计算机视觉任务。
Next-ViT和高效网络在精度-延迟权衡方面的比较
三、新框架
按照惯例,Next-ViT遵循分层的金字塔体系结构,在每个阶段都有一个patch embedding层和一系列的卷积或Transformer blocks。空间分辨率将逐步降低32×,而通道尺寸将在不同的阶段中扩大。
Next Convolution Block (NCB)
为了展示所提出的NCB的优越性,首先重新审视卷积和Transformer blocks的一些经典结构设计,下图所示。ResNet提出的BottleNeck块因其固有的归纳偏差和部署而在视觉神经网络中长期占据主导地位。大多数硬件平台的友好特性。
Next Transformer Block (NTB)
虽然通过NCB已经有效地学习了局部表示,但全局信息的捕获迫切需要解决。Transformer Block具有较强的捕获低频信号的能力,从而提供全局信息(例如全局形状和结构)。然而,相关研究观察到,Transformer Block可能会在一定程度上恶化高频信息,如局部纹理信息。不同频率段的信号在人类视觉系统中是不可缺少的,并将以某种特定的方式融合,提取更基本和明显的特征。
三、实验及结果
(a) Fourier spectrum of ResNet, Swin and Next-ViT. (b) Heat maps of the output feature from ResNet, Swin and Next-ViT.
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
Nigel AI赋能LabVIEW,NI用AI重塑测试新边界
EEPW2018年6月刊(5G)
WTC-AI型太阳能热水器电路图
AI竞争进入下半场:从“卷参数”到“卷单价”
紧凑型集成连接器模块抑制噪声 为人工智能应用实现以太网供电
基于Ai-WB2-12F与Rd-04的雷达检测系统
基于Microchip MCU的AI/ML培训教程3
研华 COMPUTEX 首度整合全球伙伴大会 强化全球边缘 AI 生态系统联结
英伟达CFO:我们早就知道内存大涨价要来了
CSR8670CSR8675智能语音Alexa蓝牙方案开发
WTC-AI太阳能热水器电路图
GPU:面临工作负载转变的高吞吐架构
爱立信携手 Net Feasa 布局海事网络 融合公网级通信与智能体 AI 赋能航运
基于VisitionX制造智能眼镜
继上次海联达Ai-ap100拆机之电源改造
EEPW2018年3月刊(工业物联网)
海联达(Aigale)Ai-HD1 无线全高清套件拆解
人工智能是如何帮助阻止造假者的?
AI 驱动估值飙升:光通信半导体企业市值暴涨
尼吉康的事业介绍
释说芯语16:硬科技:构建企业未来之路(附PPT)
赋能边缘端对话式人工智能
万家乐JSYZ5-AI燃气热水器电路图
基于Microchip MCU的AI/ML培训教程2
基于Microchip MCU的AI/ML培训教程1
瑞萨电子AI单元解决方案成功提高GE医疗(日本)日野工厂的生产力
AI热潮引发多层陶瓷电容MLCC供应短缺
iCAN-4017 AI功能模块
电子元件培训教材
PowiGaN for AI Data Centers: Unmatched Power Density and Reliability