Cadence弄潮神经网络,发布高性能DSP IP
近日,Cadence发布了首款面向汽车、监控、无人机和移动市场的神经网络DSP IP,引起了业界的关注。
本文引用地址:https://www.eepw.com.cn/article/201705/359564.htm实际上,多家公司正在推出或研制神经网络IP、芯片解决方案。Cadence的方案有何优势?Cadence公司Tensilica事业部资深市场群总监Steve Roddy为此专程来到北京,向媒体介绍其特点。
Vision C5概况
在神经网络的器件方面,英伟达主宰了通用GPU。此次Cadence Tensilica发布的神经网络DSP IP则是面向嵌入式芯片。
通常其他友商的方案是面向一个卷积神经网络(CNN)层,而最新的Cadence Tensilica Vision C5 DSP由于可配置,可以面向多种CNN。因为CNN更新很快,但从拿到IP到芯片上市通常要两三年时间,因此固化硬件的方案会导致不能满足未来的需求变化,所以并不合适,而此次发布的DSP IP带来了灵活性,适合嵌入式系统中的NN(神经网络)实现。
C5的一大亮点是计算能力可达1T MAC/s,而面积在1mm2以内(注:16nm工艺)。为何能如此高效率?原因之一是Cadence重新设计了NN加速器。通常的NN加速器中,HW(硬件) NN ACC(加速器)与Imaging(图像)DSP、CPU或GPU的通讯/连接很繁琐(如下图),可能占整个计算工作量的40%。此次发布的C5 DSP可以把上述两种功能IP/HW合二为一。
另外,Cadence还提供NN Mapper/Compiler开源软件工具。C5面向对NN有极高要求的视觉设备、雷达等,针对车载、监控、无人机、移动/可穿戴等应用。
笔者注意到,此DSP IP叫Cadence Tensilica Vision C5 DSP,“Vision”即视觉,即此DSP主要专注于计算机视觉应用。的确,在监控应用中,现在监控对实时性要求高,且数据传输到数据中心的代价巨大,不仅对网络带宽有很高的要求,另外安全性也需要保证。因此需要在终端侧部署专用的视觉CNN处理芯片,以实现在终端侧对数据进行实时,高效的处理。
C5与P6各有分工
实际上, Cadence有两类视觉DSP:一类做NN处理(例如此次发布的C5),一类做计算机视觉处理(例如Cadence的P5和P6)。二者均可配置,二者都支持多核方案。
具体应用中,常规图像处理相关的视觉应用(例如去雾、去抖、暗光等),只需要常规的计算机视觉DSP即可,可以采用Cadence的Vision P5或Vision P6。而在比如视频监控的NN处理中,需要增加Vision C5 DSP专门用于NN的处理(如下图)。
C5与友商的差异化
最近,也有FPGA公司推出视觉导向的神经网络方案,Cadence如何看?实际上,专用芯片/ASIC的功耗更低,大批量制造成本也更低。另外,FPGA支持的运行频率较低,只有几十MHz,而Vision C5可以支持几百MHz的运行频率。
专用芯片由于应用不同,因此对计算的能力与需求不同,Tensilica可以帮助推荐和配置IP数。
相比同是处理器IP厂商的Synopsys与CEVA,后两者的CNN方案需要三部分:控制、Imaging处理器、HW NN ACC(加速器)(如下图左)。Cadence此次发布的C5把后两部分集成在一起(如下图右图),因此只需要两大块,方案更为简洁,同时提高了Imaging处理的效率。
背景
据笔者所知,Cadence收购的Tensilica 是全球领先的DSP/MCU IP厂商,特点是高度可扩展,可配置,能够广泛的运用在各种不同性能要求的芯片产品领域。
被Cadence收购后,据Steve Roddy介绍,Tensilica也有着不俗的业绩:目前每年出货40亿颗以上的处理器IP,在DSP许可(Licensing)营收方面位列世界第一。聚焦音频DSP IP。全球有200家以上的生态伙伴。全球20大半导体厂商中,有17家采用了Tensilica的IP。在中国,华为、MTK等手机芯片都采用了Cadence Tensilica的Vision DSP IP。
此次推出的C5,可谓该公司一次涉入CNN领域的新探索。虽然比一些同行晚一点,但是准备得更充足。
评论