盘点2018年计算机视觉领域技术突破

作者：时间：2019-01-07 来源：网络

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

编者按：回顾2018年，是属于人工智能的一年，不论是Google、Facebook、Intel、阿里巴巴等通过产业布局进入人工智能领域的互联网企业，亦或如旷视科技Face++、极链科技Video++、优必选科技这样直接以人工智能起家的原生技术企业，都将AI注入到每个角落，掀起了一轮又一轮的技术高潮。

　　回顾2018年，是属于人工智能的一年，不论是Google、Facebook、Intel、阿里巴巴等通过产业布局进入人工智能领域的互联网企业，亦或如旷视科技Face++、极链科技Video++、优必选科技这样直接以人工智能起家的原生技术企业，都将AI注入到每个角落，掀起了一轮又一轮的技术高潮。

本文引用地址：https://www.eepw.com.cn/article/201901/396390.htm

　　因而，除了NLP研究突破接连不断，CV领域同样精彩纷呈，伴随着各式各样落地应用如此接近人们的生活，技术也变得越发成熟。本文整理了在2018年，在CV技术领域取得的最主要的一些重大技术突破。

　　BigGAN发布

　　Ian Goodfellow在2014年设计了GAN，在之后的几年中，围绕这个概念产生了多种多样的应用程序。

　　其中，在ICLR 2019论文中出现的BigGAN，同样是一个GAN，只不过更强大，是拥有了更聪明的课程学习技巧的GAN，由它训练生成的图像连它自己都分辨不出真假，因为除非拿显微镜看，否则将无法判断该图像是否有任何问题，因而，它更被誉为史上最强的图像生成器。

　　在计算机图像研究史上，BigGAN带来的突破是划时代的，比如在ImageNet上进行128×128分辨率的训练后，它的IS得分能达到166.3，是之前最佳得分52.52分3倍;除了搞定128×128小图之外，BigGAN还能直接在256×256、512×512的ImageNet数据上训练，生成更让人信服的样本。

　　英伟达Video-to-Video Synthesis

　　英伟达在2018年的收获颇丰，他们的研究焦点从标准的监督学习转向更具挑战性的机器学习，如半监督学习，领域适应，主动学习和生成模型等。其中，由英伟达在2018年末发布的最大成果之一便是视频到视频生成(Video-to-Video synthesis)，它通过精心设计的发生器、鉴别器网络以及时空对抗物镜，合成高分辨率、照片级真实、时间一致的视频，实现了让AI更具物理意识，更强大，并能够推广到新的和看不见的更多场景。

新闻中心

盘点2018年计算机视觉领域技术突破

评论

相关推荐

技术专区