新闻中心

EEPW首页 > 专题 > 异构计算带来AI视觉新突破

异构计算带来AI视觉新突破

作者:王莹 王金旺时间:2017-06-28来源:电子产品世界收藏
编者按:近年来,随着图像处理及识别等关键研究领域的突破,使人工智能在视觉应用上获得了前所未有的进步,成为AI大规模应用推广的第一个场景。为此,笔者采访了华夏芯(北京)通用处理器技术有限公司首席执行官李科奕先生,并就相关内容进行了解答。

作者 王莹 王金旺 《电子产品世界》编辑

本文引用地址:http://www.eepw.com.cn/article/201706/361120.htm

摘要:近年来,随着图像处理及识别等关键研究领域的突破,使人工智能在视觉应用上获得了前所未有的进步,成为大规模应用推广的第一个场景。为此,笔者采访了华夏芯(北京)通用处理器技术有限公司首席执行官李科奕先生,并就相关内容进行了解答。

视觉成为首推应用场景

  在所有机器处理的感知系统中,系统包含的信息量最大,也是计算机应用中最复杂和最具挑战的研究领域之一。近年来,随着图像处理及识别等关键研究领域的突破,包括卷积神经网络(Convolutional Neural Network,CNN)技术的成熟,以及大规模集成电路技术发展所带来的处理性能的大幅度提升,使人工智能(Artificial Intelligence,)在视觉应用上获得了前所未有的进步,成为AI大规模应用推广的第一个场景。例如,特定环境下的人脸识别、车辆识别、场景识别等技术,不管从识别准确度还是识别速度都已取得了惊人的成就,离理想的商业应用已经不远了,如广州的高铁安检已经开始使用人脸识别与身份证信息对照对乘客进行身份确认。

  由于视觉在人类的生产、生活中扮演着重要的角色,AI视觉的应用一直是AI研发最活跃的领域之一,随着相关技术的突破,未来的AI视觉技术将会在安防监控、汽车辅助/自动驾驶、无人机/机器人视觉领域得到广泛应用。

AI视觉面临的挑战

  AI视觉当下面临着众多挑战,从技术角度来看包括视频图像识别与处理算法、大数据分析、更先进的传感器、通讯网络与覆盖、存储及软硬件平台等。同时,针对大规模公众性AI视觉应用,还需要解决包括信息安全、个人隐私、运营与服务品质等一系列问题。假如上述问题陆续得到解决,可以预期在未来数年中,AI视觉产品与应用将无所不在。

  另外,华夏芯首席执行官李科奕还特别指出,芯片设计架构上的创新和集成电路制造工艺的快速进步为AI视觉的推广奠定了坚实的硬件基础。

AI视觉的训练与推理

  在有关AI视觉处理芯片的选择上,华夏芯认为是由应用场景来决定。

  而从目标和任务角度来看,AI在视频应用领域的工作可以划分为训练与推理两大类。

  高性能CPU/GPU集群或其它高性能计算平台处理训练

  通常情况下,训练工作适合在运维平台(云端)来做,目前业界一般采用英伟达的GPU与赛灵思的FPGA来实现计算加速,也有采用基于Intel的CPU集群来实现的。主要原因在于在典型的训练场景中,功耗、计算复杂度、实时性响应等指标虽然也很重要,但都不是要考量的第一要素。最重要的是必须确保算法在各种情况下都能获得满意的性能效果,包括动态范围好,收敛性好,适应性好等。为此而耗费较多的计算资源、功耗和时间对AI的参数进行迭代与训练,都是非常值得的。

  所以,对于基于大数据的AI学习与训练来说,李科奕表示,很多厂家采用GPU、FPGA、配置矢量处理单元的CPU计算集群、甚至于针对特定应用更为优化设计的神经网络加速器等,这些都不失为良好的学习和训练平台。尽管如此,每种平台都有局限性,存在改进和优化的空间。

  完成推理

  对于前端嵌入式视频图像AI推理芯片主要从以下几个方面考虑。第一,从算法角度讲,AI推理的结构特性极不规则,例如,不等长的、不同维度的、稀疏的矢量计算、矩阵计算等,传统架构的CPU、DSP、GPU处理效率不高;第二,前端场景变化多端,图像质量属性不一,如果要取得AI推理的良好性能,不能仅仅依靠AI算法自身,还需要辅助以更多手段与方法;第三,嵌入式的前端应用对于成本、性能、功耗、编程、生态、标准化的要求更高,而且同时存在着控制与加速计算的需求。这些巨大的挑战正是为什么目前市场上前端AI视频芯片方案还非常少、即使已有芯片方案也还存在相当局限性的原因。

  解决AI视频前端推理的最好的芯片设计理念是新一代的架构。可以很好地支撑庞大而繁杂的前端智能的广泛应用,并实现视频应用相关的人工智能产业的标准化与规范化发展,创建健康的应用生态系统。而现有市场出现的前端智能推理芯片还不能很好地适应不规则的人工智能算法的架构特性,同时满足高性能、低功耗、易编程优化等需求。因此,基于新一代异构计算架构的CPU+DSP+硬件加速器的SoC芯片平台有可能成为AI视频的主流方案之一。因为这一方案很好地利用了DSP并行计算能力突出的特点:在大部分视频应用场景中,新一代DSP的计算能力不亚于GPU与FPGA,但功耗更低、实时性更强,与单纯的神经网络加速器相比则灵活性更强。

华夏芯独特的异构计算架构理念

  按照传统理念进行分类的处理器产品在未来的芯片应用领域的空间会越来越小,取而代之的是多种计算单元融合的异构计算设计理念。针对这一发展趋势,华夏芯在业界提出了“三合一”体系架构,推出满足异构计算应用的新一代处理器IP,包括指令集、工具链以及在单一内核中实现同时满足CPU、DSP与GPU的应用需求与计算特征的微架构。这样的异构计算SoC设计既降低了用户二次开发与应用实现的门槛,又显著提升了产品的性能、功耗等核心指标,大幅度降低了用户在研发投入方面的成本与规模。

  针对AI领域的特殊需求,华夏芯研发了完全自主知识产权的处理器IP核,包括独特、先进的微架构,并推出了可变长矢量(矩阵)处理单元,从而很好地满足了AI算法处理中常出现的多维度、可变长、高并发的计算特征的普遍需求。我们的技术较传统的并行计算架构来说,不仅仅在时延、性能、功耗等关键指标上显著提升,更重要的是用户的编程门槛大幅度下降。

  目前,华夏芯正和本地AI视觉算法厂商、系统厂商密切合作,即将推出一款基于异构计算融合概念的AI视觉专用SoC。这款产品既有通用、又有专用处理单元,主要用于对AI视觉性能要求很高的安防监控、汽车辅助驾驶、等应用领域,它的定义和开发是完全基于合作伙伴及应用厂商的定制化需求,李科奕自信地表示,我们相信这款SoC及配套开发工具将成为理想的国产AI视觉开发平台。

  另外,李科奕称,下一步,华夏芯将积极参与推动相关产业联盟的发展,共建国产AI处理器推广应用平台,与业界同仁一道,加速推动我国AI相关产业的发展。

  参考文献:

  [1]李韬,网络处理器芯片的国产化之路[J].电子产品世界,2015(1):25-25.

  [2]郑小龙,国产嵌入式微处理器的探索与开拓[J].电子产品世界,2015(8):20-21.

  [3]王莹,“CPU+”异构计算时代,华夏芯通过HSA抢占高地[J].电子产品世界, 2016 (9):15-17.

  [4]陈俊颖,周顺风,闵华清.基于CAPI FPGA的医学超声成像算法异构加速[J].电子产品世界,2016(10):41-44.

  本文来源于《电子产品世界》2017年第7期第28页,欢迎您写论文时引用,并注明出处。



评论


相关推荐

技术专区

关闭