"); //-->
来源丨AIWalker
MobileOne(≈MobileNetV1+RepVGG+训练Trick)是由Apple公司提出的一种基于iPhone12优化的超轻量型架构,在ImageNet数据集上以<1ms的速度取得了75.9%的Top1精度。
高效率网络具有更强的实用价值,但学术界的研究往往聚焦于FLOPs或者参数量的降低,而这两者与推理效率之间并不存在严格的一致性。比如,FLOPs并未考虑访存消耗与计算并行度,像无参操作(如跳过连接导致的Add、Concat等)会带来显著的访存消耗,导致更长推理耗时。
为更好的分析高效率网络的瓶颈所在,作者以iPhone12平台为基准,从不同维度进行了"瓶颈"分析,见上图。从中可以看到:
具有高参数量的模型也可以拥有低延迟,比如ShuffleNetV2;
具有高FLOPs的模型也可以拥有低延迟,比如MobileNetV1和ShuffleNetV2;
上表从SRCC角度进行了分析,可以看到:
在移动端,延迟与FLOPs和参数量的相关性较弱;
在PC-CPU端,该相关性进一步弱化。
基于上述洞察,作者从先两个主要效率"瓶颈"维度上进行了对比,然后对性能"瓶颈"进行了分析并提出相应方案。
基于上述分析,MobileOne的核心模块基于MobileNetV1而设计,同时吸收了重参数思想,得到上图所示的结构。注:这里的重参数机制还存在一个超参k用于控制重参数分支的数量(实验表明:对于小模型来说,该变种收益更大)。
在Model Scaling方面类似MobileNetV2,上表给出了MobileOne不同配置的参数信息。
在训练优化方面,小模型需要更少的正则,因此作者提出了Annealing的正则调整机制(可带来0.5%指标提升);此外,作者还引入渐进式学习机制(可带来0.4%指标提升);最后,作者还采用EMA机制,最终MobileOne-S2模型达到了77.4%的指标。
实验结果上表给出了ImageNet数据集上不同轻量型方案的性能与效率对比,可以看到:
哪怕最轻量的Transformer也需要至少4ms,而MobileOne-S4仅需1.86ms即可达到79.4%的精度;
相比EfficientNet-B0,MobileOne-S3不仅具有指标高1%,同时具有更快的推理速度;
相比其他方案,在PC-CPU端,MobileOne仍具有非常明显的优势。
上表为MS-COCO检测、VOC分割以及ADE20K分割任务上的性能对比,很明显:
在MC-COCO任务上,MobileOne-S4比MNASNet指标高27.8%,比MobileViT高6.1%;
在VOC分割任务上,所提方案比MobileViT高1.3%,比MobileNetV2高5.8%;
在ADE20K任务上,所提最佳方案比MobileNetV2高12%,而MobileOne-S1仍比MobileNetV2高2.9%。
在文章最后,作者俏皮的提了一句:"Although, our models are state-of-the art within the regime of efficient architectures, the accuracy lags large models ConvNeXt and Swin Transformer"。笔者想说的是:看上图。
本文仅做学术分享,如有侵权,请联系删文。
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
AI/HPC新世代 COUPE光互连扮要角
研华科技与Axelera AI深化战略合作 加速推动基于Europa平台的边缘AI创新
思科凭借通用商用芯片与光模块赢得 AI 领域客户
基于Microchip MCU的AI/ML培训教程1
前Qwen负责人林俊旸创业,目标融资规模为数亿美元
联发科加速AI在地化应用布局
基于Microchip MCU的AI/ML培训教程3
重新构想AI电源:塑造AI加速的未来(第三部分)
基于Ai-WB2-12F与Rd-04的雷达检测系统
继上次海联达Ai-ap100拆机之电源改造
人工智能是如何帮助阻止造假者的?
尼吉康的事业介绍
基于VisitionX制造智能眼镜
iCAN-4017 AI功能模块
万家乐JSYZ5-AI燃气热水器电路图
PowiGaN for AI Data Centers: Unmatched Power Density and Reliability
存储器转型AI战略资源 台厂受惠
EEPW2018年3月刊(工业物联网)
EEPW2018年6月刊(5G)
AI聊天机器人能像医生一样推理吗?
WTC-AI型太阳能热水器电路图
释说芯语16:硬科技:构建企业未来之路(附PPT)
海联达(Aigale)Ai-HD1 无线全高清套件拆解
电子元件培训教材
基于Microchip MCU的AI/ML培训教程2
被动元件新周期:AI时代高端化、服务器化重构MLCC产业格局
瑞萨电子AI单元解决方案成功提高GE医疗(日本)日野工厂的生产力
CSR8670CSR8675智能语音Alexa蓝牙方案开发
国家“算力网”:像用水用电一样用AI
WTC-AI太阳能热水器电路图