专栏中心

EEPW首页 > 专栏 > CNN网络结构的发展——看懂这一篇就够了(2)

CNN网络结构的发展——看懂这一篇就够了(2)

发布人:数据派THU 时间:2023-08-04 来源:工程师 发布文章

6. MobileNet系列

V1

使用depthwise separable convolutions;放弃pooling层,而使用stride=2的卷积。标准卷积的卷积核的通道数等于输入特征图的通道数;而depthwise卷积核通道数是1;还有两个参数可以控制,a控制输入输出通道数;p控制图像(特征图)分辨率。

图片


图片

V2

相比v1有三点不同:1.引入了残差结构;2.在dw之前先进行1×1卷积增加feature map通道数,与一般的residual block是不同的;3.pointwise结束之后弃用ReLU,改为linear激活函数,来防止ReLU对特征的破环。这样做是因为dw层提取的特征受限于输入的通道数,若采用传统的residual block,先压缩那dw可提取的特征就更少了,因此一开始不压缩,反而先扩张。但是当采用扩张-卷积-压缩时,在压缩之后会碰到一个问题,ReLU会破环特征,而特征本来就已经被压缩,再经过ReLU还会损失一部分特征,应该采用linear。

图片图片


V3

互补搜索技术组合:由资源受限的NAS执行模块集搜索,NetAdapt执行局部搜索;网络结构改进:将最后一步的平均池化层前移并移除最后一个卷积层,引入h-swish激活函数,修改了开始的滤波器组。

V3综合了v1的深度可分离卷积,v2的具有线性瓶颈的反残差结构,SE结构的轻量级注意力模型。

图片图片


图片


7. EffNet

EffNet是对MobileNet-v1的改进,主要思想是:将MobileNet-1的dw层分解层两个3×1和1×3的dw层,这样 第一层之后就采用pooling,从而减少第二层的计算量。EffNet比MobileNet-v1和ShuffleNet-v1模型更小,进度更高。

图片


图片


8. EfficientNet

研究网络设计时在depth, width, resolution上进行扩展的方式,以及之间的相互关系。可以取得更高的效率和准确率。

图片

9. ResNet

VGG证明更深的网络层数是提高精度的有效手段,但是更深的网络极易导致梯度弥散,从而导致网络无法收敛。经测试,20层以上会随着层数增加收敛效果越来越差。ResNet可以很好的解决梯度消失的问题(其实是缓解,并不能真正解决),ResNet增加了shortcut连边。

图片


10. ResNeXt

基于ResNet和Inception的split+transform+concate结合。但效果却比ResNet、Inception、Inception-ResNet效果都要好。可以使用group convolution。一般来说增加网络表达能力的途径有三种:1.增加网络深度,如从AlexNet到ResNet,但是实验结果表明由网络深度带来的提升越来越小;2.增加网络模块的宽度,但是宽度的增加必然带来指数级的参数规模提升,也非主流CNN设计;3.改善CNN网络结构设计,如Inception系列和ResNeXt等。且实验发现增加Cardinatity即一个block中所具有的相同分支的数目可以更好的提升模型表达能力。

图片


图片


11. DenseNet

DenseNet通过特征重用来大幅减少网络的参数量,又在一定程度上缓解了梯度消失问题。

图片


12. SqueezeNet

提出了fire-module:squeeze层+expand层。Squeeze层就是1×1卷积,expand层用1×1和3×3分别卷积,然后concatenation。squeezeNet参数是alexnet的1/50,经过压缩之后是1/510,但是准确率和alexnet相当。

图片


13. ShuffleNet系列

V1

通过分组卷积与1×1的逐点群卷积核来降低计算量,通过重组通道来丰富各个通道的信息。Xception和ResNeXt在小型网络模型中效率较低,因为大量的1×1卷积很耗资源,因此提出逐点群卷积来降低计算复杂度,但是使用逐点群卷积会有副作用,故在此基础上提出通道shuffle来帮助信息流通。虽然dw可以减少计算量和参数量,但是在低功耗设备上,与密集的操作相比,计算、存储访问的效率更差,故shufflenet上旨在bottleneck上使用深度卷积,尽可能减少开销。

图片

V2

使神经网络更加高效的CNN网络结构设计准则:

  • 输入通道数与输出通道数保持相等可以最小化内存访问成本;
  • 分组卷积中使用过多的分组会增加内存访问成本;
  • 网络结构太复杂(分支和基本单元过多)会降低网络的并行程度;
  • element-wise的操作消耗也不可忽略。

图片

14. SENet

图片

15. SKNet

图片


专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: AI

相关推荐

EEPW2018年6月刊(5G)

资源下载 2018-06-11

电子元件培训教材

联发科加速AI在地化应用布局

智能计算 2026-05-19

PowiGaN for AI Data Centers: Unmatched Power Density and Reliability

视频 2025-12-19

国家“算力网”:像用水用电一样用AI

2026-05-18

CSR8670CSR8675智能语音Alexa蓝牙方案开发

资源下载 2017-12-14

研华科技与Axelera AI深化战略合作 加速推动基于Europa平台的边缘AI创新

尼吉康的事业介绍

视频 2025-07-25

存储器转型AI战略资源 台厂受惠

网络与存储 2026-05-19

AI聊天机器人能像医生一样推理吗?

EEPW2018年3月刊(工业物联网)

思科凭借通用商用芯片与光模块赢得 AI 领域客户

前Qwen负责人林俊旸创业,目标融资规模为数亿美元

2026-05-14

重新构想AI电源:塑造AI加速的未来(第三部分)

基于Microchip MCU的AI/ML培训教程1

视频 2025-11-12

基于Microchip MCU的AI/ML培训教程2

视频 2025-11-12

基于Microchip MCU的AI/ML培训教程3

视频 2025-11-12

被动元件新周期:AI时代高端化、服务器化重构MLCC产业格局

AI/HPC新世代 COUPE光互连扮要角

网络与存储 2026-05-15
更多 培训课堂
更多 焦点
更多 视频

技术专区