专栏中心

EEPW首页 > 专栏 > 推理速度快YOLOV4五倍的YOLObile:通过压缩编译在移动端实时检测

推理速度快YOLOV4五倍的YOLObile:通过压缩编译在移动端实时检测

发布人:CV研究院 时间:2020-09-17 来源:工程师 发布文章

目标检测技术的迅速发展和广泛应用,引起了人们对目标检测器的精度和速度的关注。然而,目前最先进的目标检测工作要么是精度导向使用大模型,但导致高延迟,要么是速度导向使用轻量级模型,但牺牲精度。在这项工作中,作者提出了YOLObile框架,通过压缩编译协同设计在移动设备上实时检测对象。提出了一种适用于任意核大小的块穿孔剪枝方案。为提高移动设备上的计算效率,采用GPU-CPU协同方案,并辅以高级编译器辅助优化。实验结果表明,新提出的剪枝方案在49.0 mAP的情况下,可以实现YOLOv4的14倍压缩率。在YOLObile框架下,使用三星Galaxy S20的GPU实现了17 FPS的推理速度。通过加入新提出的GPU-CPU协同方案,推理速度提高到19.1帧/秒,比原来的YOLOv4加速5倍。

1600324641897521.jpg1600324648676000.jpg1600324655190990.jpg1600324662767613.jpg1600324668848482.jpg1600324674976884.jpg1600324684101686.jpg1600324691514593.jpg1600324699931958.jpg1600324705917468.jpg1600324711948565.jpg

总结

在本次工作中,提出了一个基于压缩编译协同设计的移动设备实时目标检测框架YOLObile。此外,还提出了一种新的剪枝方案——区块剪枝,该方案适用于任意核大小的卷积层和全连接层。为了提高移动设备上DNNs的计算效率,除了新提出的编译器优化之外,提出的YOLObile还提供了一个GPU-CPU协同计算方案。经过实验证明,新提出的YOLObile框架展现出了高准确性、高效率,并同时实现了高硬件并行性!


专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词:

相关推荐

兆易创新携全系产品及解决方案亮相2025上海慕展

Cadence率先推出eUSB2V2 IP解决方案

EDA/PCB 2025-04-16

英特尔出售旗下 Altera芯片业务51%股份

基础视频: 琐相环的基本原理

视频 2012-06-18

安谋科技亮相2025世界互联网大会亚太峰会

接口与隔离演示

视频 2012-06-18

全国集成电路标准化技术委员会首次“标准周”活动在沪举办

2025-04-16

ADI IIC-China 2012现场花絮

视频 2012-06-18

纳芯微携新品新系列亮相上海慕展,引领“芯”未来

从工业到生活:欧姆龙多场景数智低碳技术\"电\"亮2025慕尼黑上海电子展

兆易创新推出GD5F1GM9系列高速QSPI NAND Flash

Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电阻

猜猜Big Daddy的火箭上升过程中的加速度,赢取iPad!

视频 2012-06-18

Keil C51 6.02 版

资源下载 2007-02-09

Keil C51 6.0

资源下载 2007-02-09

重塑芯片规则,国内RISC-V新突破

基于AD9822和CIS传感器的验钞机AFE方案

视频 2012-06-18
更多 培训课堂
更多 焦点
更多 视频

技术专区