新闻中心

EEPW首页 > 智能计算 > 设计应用 > 详解人工智能芯片 CPU/GPU/FPGA有何差异?

详解人工智能芯片 CPU/GPU/FPGA有何差异?

作者:时间:2017-04-01来源:行业报告研究院收藏
编者按:CPU与GPU在各自领域都可以高效地完成任务,但当同样应用于通用基础计算领域时,设计架构的差异直接导致了两种芯片性能的差异。

  4.行业的佼佼者:Nvidia

本文引用地址:http://www.eepw.com.cn/article/201704/346122.htm

  目前全球行业的市场份额有超过70%被英伟达公司占据,而应用在人工智能领域的可进行通用计算的市场则基本被英伟达公司垄断。

  2016年三季度英伟达营收为20.04亿美元,较上年同期的13.05亿美元增长54%;净利润为5.42亿美元,较上年同期的2.46亿美元增长120%,营收的超预期增长推动其盘后股价大幅上涨约16%。以面向的市场平台来划分,游戏业务营收12.4亿美元,同比增长63%,是创造利润的核心部门;数据中心业务营收2.4亿美元,同比增长193%,成为增长最快的部门;自动驾驶业务营收1.27亿美元,同比增长61%,正在逐步打开市场。



  这样的业绩创下了英伟达的历史最好季度收入,但这并非是其股票暴涨的理由,事实上,在过去的六年里,英伟达的业绩基本一直呈现上升趋势。从2012年财年至2016财年,英伟达的营业收入实现了从40亿美元到50亿美元的跨越,而其净利润也从2012财年的5.8亿美元逐步上升到了2016财年的6.14亿美元。但在此期间,英伟达的股价并未出现翻番式的增长。

  真正促成英伟达股价飙升的是人工智能的新市场。在刚刚过去的2016年,英伟达的股价上涨了228%,过去的5年内累计上涨500%。500亿美元的市值将会持续给英伟达带来40倍的市场收入,这几乎是业内拥有最高收益的公司。

  5.Nvidia的市场定位:人工智能计算公司

  自1999年发布第一款GPU以来,GPU就成为了英伟达最为核心的产品,占到了英伟达总营业收入的八成,而英伟达也以显卡厂商的身份进入人们的视线。这些芯片最初是以板卡的形式出售给游戏玩家的,游戏玩家需要自己动手将芯片装到PC主板上,从而拥有更快的3D图形处理速度。他们的产品命名也很有讲究,用“GeForce”这样具有超能力的字眼来开辟市场。

  今日的英伟达,已经不再是一家单纯的显卡技术厂商,他现在很赶时髦地称自己为“人工智能计算公司”。据英伟达官网数据显示,2016年,有近两万家机构将英伟达产品用于深度学习加速计算,相比2014年翻了13倍。医疗、生命科学、教育、能源、金融、汽车、制造业以及娱乐业等诸多行业均将得益于海量数据的分析。

  谷歌、微软、Facebook 和亚马逊等技术巨头大量购买英伟达的芯片来扩充自己数据中心的处理能力;Massachusetts General Hospital等医疗研究机构用英伟达的芯片来标记CT扫描图片上的病变点;特斯拉将在所有的汽车上安装英伟达的芯片来实现无人驾驶; June等家电公司用英伟达的芯片制造人工智能驱动的家用电器。在人工智能到来之前,英伟达从来都没有处于一个如此巨大的市场的中心,这也充分表明了一个事实,那就是英伟达在GPU的计算处理技术上无人能及。

  同时,英伟达还在投资不同领域里新兴的、需要借助深度学习来构建业务的公司,使这些公司能够更好地借助其提供的人工智能平台起步,这类似于以前一些初创公司通过微软Windows来构建服务以及最近通过iTunes来发布应用。



  6.Nvidia的核心产品:Pascal家族

  英伟达的传统强项是桌面和移动终端的GPU,但是坚定地向着人工智能大步迈进的英伟达显然已经不满足于仅仅在单一领域做提高GPU性能的事了。相比于传统的计算密集型GPU产品来说,英伟达努力的方向是使得GPU芯片不仅仅只针对训练算法这一项起到作用,更是能处理人工智能服务的推理工作负载,从而加速整个人工智能的开发流程。目前该公司的核心产品包括基于Pascal架构的TeslaP4与Tesla P40深度学习芯片,这两款芯片均已于2016年第四季度开始投入量产。

  Tesla P4为资料中心带来最高的能源效率

  其小尺寸及最小50瓦特的低功率设计可安装于任何服务器内,让生产作业负载推论的能源效率达CPU的40倍。在进行视频推论作业负载时,单一服务器裡安装单颗Tesla P4即可取代13台仅采用CPU的服务器,而包含服务器及用电量的总持有成本则能节省达8倍。

  Tesla P40为深度学习作业负载带来最大的处理量

  一台搭载8颗Tesla P40加速器的服务器拥有每秒47兆次运算的推论性能及INT8指令,可取代140台以上的CPU服务器的性能。若以每台CPU服务器约5,000美元计算,可节省65万美元以上的服务器采购成本。

  基于上述两种人工智能芯片,英伟达为资料中心提供唯一的端对端深度学习平台,并能够将训练时间从数天大幅缩短至数小时,从而实现资料的立即解析与服务的及时回应。

  7.Nvidia的应用布局:自动驾驶

  不仅仅是底层架构,英伟达在应用层面上也有非常明确的布局,其中最看重也最有领先优势的就是自动驾驶。早在2014年1月,英伟达就发布了为移动平台设计的第一代Tegra系列处理器,适用于智能手机、平板电脑和自动驾驶汽车,四个月后,DRIVE PX自动驾驶计算平台发布,可实现包括高速公路自动驾驶与高清制图在内的自动巡航功能。同年10月,搭载了Tegra K1处理器并应用了DRIVEPX计算平台的特斯拉新款Model S开始量产,英伟达成为第一个享受到自动驾驶红利的厂商。

  2016年英伟达在自动驾驶领域并没有什么重大突破,基本只是从技术升级及厂商合作两个方面入手,除了特斯拉这个老朋友外,百度、沃尔沃也跟英伟达达成了合作,他们都将生产搭载DRIVE PX 2的智能驾驶汽车。恰逢此时,AI概念变得更加火热,智能驾驶也逐渐成熟,这些客观因素让英伟达收割了更多的红利,也让公司站在了聚光灯之下。

  从整个自动驾驶行业来看,Google、苹果、微软等科技公司都在建立自己的汽车生态体系,不过智能汽车对于他们来说都不是核心业务,更为重要的是,他们并没有真正进入汽车供应链体系。与之相反,英伟达的Drive PX系列自动驾驶解决方案,已经进入了汽车的上游供应链中,并创造了利润,这也意味着英伟达将在汽车芯片市场与英特尔、高通、恩智浦、瑞萨电子等做CPU的公司正面碰撞,自动驾驶的风口让英伟达在汽车市场从“边缘人”变成了挑战者。

  随着特斯拉Model S等备受瞩目的车型更加智能化与多媒体化,英伟达有了弯道超车的机会,并有望在汽车产业的上游供应链占据更有优势的地位。最新款的Tegra系列处理器功耗只有10瓦,几乎与同等级的产品功耗持平甚至更低,这对于车载移动芯片来说是巨大的优势。

  但同样的,单移动处理器的架构和极低的功耗必然无法支撑起超大规模的运算,目前英伟达计算平台的功能定位仅聚焦于高速公路上的自动巡航,而CPU的应用可以拓展至车机娱乐信息系统层面。未来自动驾驶的发展方向必然是整车的控制中心,从目前英伟达基于Tesla架构的主流芯片来看,低功耗、极速运算与逻辑控制是可以同时实现的,英伟达公司在自动驾驶领域的优势非常明显。

  8.Nvidia的产业优势:完善的生态系统

  与其它芯片公司相比,带有CUDA的重点软件生态系统是英伟达占领人工智能市场的关键促成因素。从2006年开始,英伟达发布了一个名叫CUDA的编程工具包,该工具包让开发者可以轻松编程屏幕上的每一个像素。在CUDA发布之前,给GPU编程对程序员来说是一件极其痛苦的事,因为这涉及到编写大量低层面的机器码以实现渲染每一个不同像素的目标,而这样的微型计算操作通常有上万个。CUDA在经过了英伟达的多年开发之后,成功将Java或C++这样的高级语言开放给了GPU编程,从而让GPU编程变得更加轻松简单,研究者也可以更快更便宜地开发他们的深度学习模型。

  四、未来市场:半定制芯片

  技术世界正在迈向一个全新的轨道,我们对于人工智能的想象已经不再局限于图片识别与声音处理,机器,将在更多领域完成新的探索。不同领域对计算的需求是差异的,这就要求深度学习的训练愈发专业化与区别化。芯片的发展趋势必将是在每一个细分领域都可以更加符合我们的专业需求,但是考虑到硬件产品一旦成型便不可再更改这个特点,我们不禁开始想,是不是可以生产一种芯片,让它硬件可编程。

  也就是说,这一刻我们需要一个更适合图像处理的硬件系统,下一刻我们需要一个更适合科学计算的硬件系统,但是我们又不希望焊两块板子,我们希望一块板子便可以实现针对每一个应用领域的不同需求。这块板子便是半定制芯片,便是未来人工智能硬件市场的发展方向。



关键词: GPU FPGA

评论


相关推荐

技术专区

关闭