新闻中心

EEPW首页 > 编辑观点 > 各大巨头纷纷入局DPU: DPU真正的魅力何在?

各大巨头纷纷入局DPU: DPU真正的魅力何在?

作者:陈玲丽时间:2020-12-14来源:电子产品世界收藏

过去十年中,计算已经不仅仅局限在个人电脑和服务器内,CPU和GPU已经被广泛地用于各个新型超大规模数据中心。这些数据中心通过功能强大的新型处理器连接在一起,( Data Processing Unit ,数据处理器)已经成为了以数据为中心的加速计算模型的第三个计算单元。

本文引用地址:http://www.eepw.com.cn/article/202012/421172.htm

CPU用于通用计算,GPU用于加速计算,而数据中心中传输数据的则进行数据处理。

截屏2020-12-14 22.32.45.png

欢迎来到启用的数据革命时代

根据现今最著名的历史学家之一Yuval Noah Harari的说法 ,人类面临着四次重大革命:

截屏2020-12-14 22.33.46.png

· 公元前70,000年发生的认知革命定义了语言的诞生和交流的能力。它也克服了尼安德特人,将智人带到了舞台的前列。

· 农业革命发生在公元前10000年,它定义了人类驯养家畜和种植农作物的能力,加速了人类人口的增长,推动了城市的崛起。

· 科学革命是一系列事件,标志着现代科学在早期现代时期的出现,当时数学、物理、天文学和科学的发展为我们现代生活方式奠定了基础。

· 我们今天目睹的第四次革命是数据革命。

与之前的重大技术变革(例如个人计算机、客户端服务器甚至虚拟化)不同,数据革命比以前的革命更隐蔽。这种转变的核心是需要发动下一次重大技术飞跃,其中机器学习是实现真正人工智能的起点。为了达到这个目标,我们需要处理大量的数据。

随着我们进入数据革命时代,对更高计算性能的不断增长的需求正在推动新的数据中心加速器和处理单元的诞生。以前CPU和GPU是计算能力的主要来源。数据量和复杂性的指数级增长推动了以数据为中心的体系结构和新型加速器单元的创建。

在以数据为中心的设计中,完整的基础架构堆栈(包括计算,存储和网络)的架构旨在快速有效地捕获、分析、分类、管理和存档大量数据,新一代加速器应运而生 —— DPU。

CPU,GPU和DPU的组合是协同处理的下一个飞跃,它将利用这些革命性的硬件加速技术和软件定义的可编程性来应对以数据为中心和边缘计算架构的挑战,最大程度地提高投资回报率,并使不可能成为可能。

DPU有什么与众不同之处?

为什么人们如此渴望使用DPU?首先,它更安全,因为控制平面可以在系统内和系统集群之间与数据平面分离。目前服务器要处理的资料日益增多,除了原有的加解密、封包压缩外,加速器也让服务器要处理的资料量变得更庞大,就会造成原有CPU在处理安全能力表现上出现瓶颈。

DPU可以执行原本需要CPU处理的网络、存储和安全等任务。这就意味着如果在数据中心中采用了DPU,那么CPU的不少运算能力可以被释放出来,去执行广泛的企业应用。

DPU的主要作用就在于替代了数据中心原本用来处理分布式存储和网络通信的CPU处理器资源。在DPU之前,智能网卡(SmartNIC)正在网络安全和网络互连协议方面逐渐取代CPU。而现在DPU的出现,相当于是智能网卡的升级替代版本,一方面增强了智能网卡对网络安全和网络协议的处理能力,一方面又整合和加强了分布式存储的处理能力,从而在这两个领域更好地替代CPU,从而释放CPU的算力给到其他更多应用。

有了DPU的出现,就可以先在DPU将大量的信息先做消化,接着再传递给CPU做其他的分配,如此一来能减少CPU约30%的消耗。

DPU是一种新型可编程处理器,是一种SOC(System On Chip),它结合了:

· 行业标准的、高性能及软件可编程的多核CPU,通常基于已应用广泛的Arm架构,与其的SOC组件密切配合。

· 高性能网络接口,能以线速或网络中的可用速度解析、处理数据,并高效地将数据传输到GPU和CPU。

· 各种灵活和可编程的加速引擎,可以卸载AI、机器学习、安全、电信和存储等应用,并提升性能。

DPU引入机器学习算法可对数据进行智能管理、控制和分析,从而减少闪存擦写次数,延长SSD使用寿命;还可减少盘内计算和总线数据量,减轻主机CPU的负担。所有这些DPU功能对于实现安全的、裸性能的、原生云计算的下一代云上大规模计算至关重要。

CPU、GPU、DPU将代表未来计算的三大支柱。这三者之间,CPU用于通用计算,GPU用于加速计算,而DPU在数据中心周围移动数据进行数据处理。DPU可以和CPU、GPU相结合,构成完全可编程的单一AI计算单元,实现前所未有的安全性和算力支持。

截屏2020-12-14 22.35.53.png

国际巨头开始纷纷提前布局

自1950年代以来,中央处理器“ CPU”一直是每台计算机或智能设备的核心;到1990年代以来,GPU或图形处理单元扮演了重要角色。在过去的十年中,计算已经摆脱了PC和服务器的繁琐局限,CPU和GPU为庞大的新超大规模数据中心提供了动力。然而最近几年,随着系统中的CPU承受越来越多的网络和存储工作负载,DPU已成为以数据为中心的加速计算模型的第三个成员。

根据THENEXTPLATFORM的分析指出,在2020年,在这个领域的玩家或者潜在玩家主要包括Broadcom、Intel、英伟达、Netronome、Pensando、Fungible和Xilinx,还包括云供应商三大巨头。

DPU是英伟达最新的一个布局。英伟达对DPU尤为重视,最主要的布局就在于2019年3月,花费69亿美元收购了以色列芯片公司Mellanox —— Mellanox在2015年9月以8.11亿美元的天价收购了EZchip公司,该公司拥有多核芯片创业公司Tilera的资产,Tilera是最早使用知识产权的高度并行SmartNIC实施之一,该实施源自更早的MIT研究项目。

Mellanox所擅长的正是为服务器、存储和超融合基础设施提供包括以太网交换机、芯片和InfiniBand智能互连解决方案在内的大量的数据中心产品。英伟达的GPU与Mellanox的互连技术结合,可以使得数据中心工作负载将在整个计算、网络和存储堆栈中得以优化,并能实现更高的性能、更高的利用率和更低的运营成本。

黄仁勋把Mellanox的技术看作是公司的“X因素”,也就是把数据中心改造成一个可以解决高性能计算要求的大型处理器架构。而如今我们看到DPU的出现,已经是具有这一架构雏形的一种尝试了。

英伟达在DPU上的技术突破,是在收购Mellanox之后,在这家公司的硬件基础上开发出BlueFeild系列的两款DPU —— 英伟达BlueField-2 DPU与BlueField-2X DPU。

截屏2020-12-14 22.37.40.png

英伟达发力DPU建设的深层目的:一个是DPU试图再一次复制GPU替代显示加速卡成为通用显示芯片的路径;再一个是DOCA试图再一次复制CUDA在GPU通用化过程中所起到的开创生态之功。

与此同时,随着数据中心网络中传送的数据量以每年25%的速度增长,英特尔也对DPU很感兴趣。因为预算不能以这种速度增长,而且由于对原始CPU计算的偏见投资(与构建平衡的系统以更充分地利用可用的计算能力相反),网络通常不超过分布式成本的10%系统。面对所有这些压力,英特尔必须创新并帮助改善网络,英特尔认为集成显得很重要。

在DPU上,英特尔主要是将CPU和FPGA结合在一起,但英特尔并自己做,而是由Inventec和Silicom制造的。前者对于hyperscalers和云构建者来说是日益重要的ODM,而后者则是过去二十年来的网络接口供应商。

另外,英特尔收购了深度学习芯片公司Nervana Systems,以及移动和嵌入式机器学习公司Movidius,给未来的深度学习下了重注。而英特尔所做的这一切,正是在为未来适应深度学习的数据流(DPU)架构升级布局。

越来越多供应商纷纷涌入DPU架构。DPU能否演绎CPU和GPU的佳话?十年前,随着硬件加速技术的第一次重大冲击,我们对GPU产品充满了兴趣。现在,随着FPGA扩展到超过300万个逻辑单元,FPGA得以与其他可组合的处理模块紧密地结合在一起,以实现网络、内存、存储和计算。有了这些进步,我们开始认识到第二次硬件加速浪潮的形成。让我们静待其变。

英伟达挑战英特尔,距离还有多远

另外一个值得注意的是英伟达提出配合DPU处理器的软件开发工具包 —— DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。英伟达的专家将DOCA类比为数据中心服务器领域的CUDA,其意图在于帮助开发人员在DPU加速的数据中心基础设施上构建相应的应用程序,从而丰富DPU的应用开发生态。

如果和不久前英伟达收购ARM的消息结合起来,我们看到英伟达的一个重要考量,就是以ARM架构的CPU为核心,从服务器的应用加速扩展到服务器的全部应用场景,从而实现在数据中心服务器领域的更大突破,目标自然是英特尔CPU为代表的X86服务器生态。

自从英伟达开始收购ARM,外界能够看到英伟达已经多次显示出其试图利用ARM处理器进一步占领数据中心服务器市场的决心,而集成了ARM核心的DPU将成为其打入数据中心存量市场取代X86 CPU的第一个切入点。

英伟达推出DPU来切入这个市场,而非直接用ARM核心CPU来与X86 CPU直接竞争,其实是一种比较讨巧的做法,相当于用集成了网络、存储、安全等任务的下一代CPU产品来达到逐渐替换CPU的目的,即使其中所内涵的ARM CPU性能无法对标同一代的X86 CPU,但是整体机由于在DPU SoC上集成了专用的处理加速模块,因此总体性能一定是超过X86 CPU的。

但是英伟达想要在中高端处理器市场来挑战英特尔,还要面临一系列的困难。首先,正是英伟达的GPU与X86 CPU已经形成一种非常稳定的强互补关系。英伟达想要采用基于ARM架构的处理器做高端服务器,还需要ARM处理器性能出现大幅的提升,而现在这一进程并不明朗。

英伟达在数据中心领域的成功与否,都与能否实现数据中心的规模化运算有关,从发展自研的DGX系列服务器到整合Mellanox的技术,再到借助ARM生态发展全新的数据中心计算架构,都是为转型数据中心业务所作的准备。当然,想要实现这一目标,还要看下英特尔如何应对。

英特尔早已为应对英伟达的种种挑战进行了相应的回应和布局。早在2017年,英特尔就宣布要开发全栈的GPU产品组合,而预计明年英特尔的首批GPU将在使用GPU的各个市场上发布。

目前来说,数据中心当中,95%左右的GPU仍然还是连接到x86的CPU之上,英伟达如果单纯只是做GPU的增量,仍然无法撼动英特尔在数据中心服务器的霸主地位。

数据中心业务对于英特尔来说,也正在成为其最核心的业务组成。2019年Q4英特尔的数据中心业务超越PC业务,成为其收入的主要来源;而在今年,英特尔对其技术组织和执行团队的重组,也被外界视为全面转型数据中心业务的开始。

可以想见在未来的数据中心处理器业务上,英伟达将迎来英特尔最为强劲的保卫战和反击战,而广大的服务器集成商或将成为这场角力赛的受益方。

英伟达还要面对ADM这一新对手的追赶,不久前ADM曝出要花费300亿美金收购赛灵思,就被看作是叫板英特尔,阻击英伟达的双战略。

除此之外,英伟达还要在数据中心处理器业务中面临来自客户自研芯片的挑战。云服务商本身也不愿意完全将自身的计算核心完全交给英伟达,无论是AWS、还是谷歌、阿里巴巴、华为,都已经在布局自己的云端处理器。

数据中心已经成为英特尔、英伟达、AMD这些老牌芯片巨头未来争夺的主战场,DPU是数据中心战场中重要一役。

作为一个“芯”生事物,走稳是当下的要务。DPU还在早期阶段,这走的或是类似GPU的革命路线。GPU刚出来时业界均不看好,但英伟达却矢志不渝,不断迭代和优化,最终GPU一路狂奔,到最后全面接管了图形图像的显示控制,并在AI时代成为主力核心。但DPU真的会成另一个GPU吗?



关键词: DPU

评论


技术专区

关闭