博客专栏

EEPW首页 > 博客 > 语义分割综述(3)

语义分割综述(3)

发布人:计算机视觉工坊 时间:2021-10-07 来源:工程师 发布文章

FastFCN:重新思考语义分割主干中的扩张卷积

论文:FastFCN: Rethinking Dilated Convolution in the Backbone for Semantic Segmentation (2019)

代码:https://github.com/wuhuikai/FastFCN

本文提出了一个名为Joint Pyramid Upsampling(JPU)的联合上采样模块来代替消耗大量时间和内存的扩张卷积。它的工作原理是将提取高分辨率地图的功能制定为联合上采样问题。

该方法在 Pascal Context 数据集上实现了 53.13% 的 mIoU 性能,并且运行速度提高了 3 倍。

19.png

该方法实现了一个全连接网络(FCN)作为主干,同时应用 JPU 对低分辨率的最终特征图进行上采样,从而产生高分辨率的特征图。用 JPU 替换扩张卷积不会导致任何性能损失。

20.png

联合采样使用低分辨率目标图像和高分辨率引导图像。然后通过传输引导图像的结构和细节来生成高分辨率的目标图像。

通过视频传播和标签松弛改进语义分割

论文:FastFCN: Rethinking Dilated Convolution in the Backbone for Semantic Segmentation (2019)

代码:https://github.com/NVIDIA/semantic-segmentation

本文提出了一种基于视频的方法,通过合成新的训练样本来扩展训练集。这旨在提高语义分割网络的准确性。它探索了视频预测模型预测未来帧以预测未来标签的能力。

21.png

该论文表明,在来自合成数据的数据集上训练分割网络可以提高预测精度。本文提出的方法在 Cityscapes 上实现了 83.5% 的 mIoU,在 CamVid 上实现了 82.9%。

22.png

论文提出了两种预测未来标签的方法:

标签传播 (Label Propagation, LP) 通过将传播的标签与原始未来帧配对来创建新的训练样本

联合图像标签传播 (Joint image-label Propagation, JP) 通过将传播标签与相应的传播图像配对来创建新的训练样本

该论文有三个主要命题;利用视频预测模型将标签传播到直接相邻帧,引入联合图像标签传播来处理未对齐问题,并通过最大化沿边界的类概率并集的可能性来放松单热标签训练。

23.png

Gated-SCNN:用于语义分割的门控形状 CNN

论文:Gated-SCNN: Gated Shape CNNs for Semantic Segmentation (2019)

代码:https://nv-tlabs.github.io/GSCNN/

这篇论文是语义分割块上的最新成果。作者提出了一种双流 CNN 架构。在此架构中,形状信息作为单独的分支进行处理。此形状流仅处理与边界相关的信息。这是由模型的门控卷积层 (GCL) 和本地监督强制执行的。

24.png

该模型在 mIoU 上比 DeepLab-v3+ 高 1.5%,在 F 边界得分上高出 4%。该模型已使用 Cityscapes 基准进行评估。在更小更薄的物体上,该模型在 IoU 上实现了 7% 的改进。

下表显示了 Gated-SCNN 与其他模型相比的性能。

25.png

结论

我们现在应该掌握一些最常见的——以及一些最近的——技术,用于在各种上下文中执行语义分割。

在公众号后台回复关键字 “0009” 即可获取以上论文

原文链接:

https://heartbeat.comet.ml/a-2019-guide-to-semantic-segmentation-ca8242f5a7fc

本文仅做学术分享,如有侵权,请联系删文。

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。



关键词: 深度学习

相关推荐

技术专区

关闭