中科驭数DPU技术开放日
一、DPU的产业应用价值及落地情况
本文引用地址:https://www.eepw.com.cn/article/202403/457021.htm· 证券基金行业
金融信创已步入深水区,由“边缘替代”迈向“核心替代”。在金融行业,核心交易系统对网络时延的需求从毫秒级提升到微秒甚至纳秒,低时延网络领域的核心设备长期被国外厂商Solarflare与Mellanox垄断,时延和安全问题成了制约银行、证券、期货等行业发展的难点之一,行业内纯软件的加速方案遭遇瓶颈,超低时延网络解决方案可有效解决这一难题,并实现完全自主可控。
中科驭数基于自主研发的低时延网络DPU卡构建超低时延网络,支撑金融交易核心链路从底层硬件到上层应用系统具备超低时延、低抖动、完全自主可控等特性,在超低时延网络领域真正打破垄断,实现国产升级替代。目前,中科驭数的DPU系列产品已经在金融证券领域实现规模化落地,同时也是上交所天相实验室、以及申万宏源、东证期货等低时延实验室参与方,助力超过30家金融机构完成核心超低时延系统替换,有力保障金融系统的平稳运行。
以国内某头部证券机构厂商的落地情况为例,中科驭数低时延网络DPU卡在部署某金融机构核心交易系统之后,解决了该金融机构交易系统的低时延问题,帮助高频交易客户实现交易全链路时延优化,满足了核心交易场景下对低时延、低抖动的极致要求。
中科驭数低时延网络DPU卡作为证券交易链路的关键一环,对于证券行业全国产信创改造至关重要。申万宏源联合中科驭数等多家软硬件厂商成立低时延实验室,针对国内证券机构核心业务全信创改造的可能性进行了权威实验测试,全面对比了全信创方案与非信创方案在基础设施测评、以及业务系统测评下的不同技术性能表现。测试结果显示,基于当前性能最优的超频服务器,与Arista7150构成的集成测试环境中,D厂柜台在使用中科驭数网卡时性能表现最佳,柜台应答全链路时延领先17%;相比当前半信创生产环境,采用华为CE6885 + 鲲鹏920 + 中科驭数SWIFT-2200N,在全信创环境下整体提升6%-11%。链接参考:https://mp.weixin.qq.com/s/kpA32s8X1oJiFmwy6DKvmQ
随着信创全面提速和展开,信创云也是当前证券机构上云的重要选择。东方证券信创云平台历时4年多的持续建设和技术积累,目前已初具规模。从2023年开始,东方证券开始和中科驭数接触,进行相关技术研讨和产品的POC测试,尝试引入低时延技术引入到我们信创云之中。随着国产DPU卡的引入,进一步优化低时延信创云平台业务架构,围绕信创建设和时延优化双重目标,打造一云多芯、超低时延的信创云。“一云多芯” 作为信创产业链承上启下的关键环节,对下纳管多种国产CPU和DPU网络设备,实现统一调度资源,屏蔽底层差异性;对上兼容各种国产操作系统、国产数据库和各类低时延应用。
· 银行
在银行领域,近年来移动互联网与金融科技的飞速发展,银行数据中心的业务请求数量以及数据处理数量极速上涨。同时由于金融创新需求,银行业开展的的业务种类也呈现爆发式增长。这些现状都对银行业的IT基础设施,尤其是云化设施提出了新的严苛挑战。随着云原生技术的发展,其更加轻量的应用部署策略与更加完善的生命周期管理机制,逐渐成为下一代云计算的操作系统基座。同时,随着数据中心网络带宽的更新换代以及存储技术的进步,云计算基础设施消耗的CPU资源逐渐增加。
在此背景下,作为中科驭数重要客户的某大型国有银行希望能借助新兴的DPU技术完成下一代云计算系统的验证与建设,达到降本增效的目的。中科驭数解决方案可以匹配该银行的各种应用需求,包括高性能网络、存储底座,虚拟机、容器与裸金属服务器的共池管理,VPC网络等,可以帮助银行数据中心高效、安全、平稳地过渡到云原生业务架构。
· 云计算
中科驭数的DPU产品已经在某头部云计算厂商的云数据中心中落地。基于DPU的方案使得裸金属服务的业务逻辑发生了明显变化,可以大大缩短裸金属服务的交付时间,实现了虚拟网络功能的全面卸载,也为存算分离相关的多种存储技术提供了统一的接口。中科驭数自主研发的DPU产品不但能够提升云数据中心业务的性能表现,节省宝贵的算力资源,还可以从根本上消除非国产设备导致的潜在安全风险。
在某大型金融机构的数据中心中,DPU的高吞吐和低延迟特性帮助了该数据中心高效、安全、平稳地过渡到云原生业务架构,为其打造了更为高效可靠、自主可控的金融交易底座。凭借DPU芯片在新型数据中心的落地实践,中科驭数相关产品和解决方案获评新型数据中心创新发展案例。
· 5G通信
中科驭数是国内三大运营商的硬件合作伙伴,共同探索DPU在5G通信和云计算领域的技术解决方案。在5G通信网络快速发展的过程中,算力和网络融合发展需要更加绿色高效的数据处理硬件加速技术,亟待DPU提升系统性能。DPU将在高性能数据处理、低延迟数据传输、网络管理、存储以及安全等基础设施底层建设发挥关键作用。DPU通过接手CPU不擅长的网络协议处理、数据加解密等数据处理任务,不仅可以提高网络传输效率,而且释放了CPU算力资源。在新型算力DPU的加持下,能够提供灵活高效的硬件加速服务,支持云基础设施层功能卸载,云边协同、云网一体都将逐步实现。
联通研究院曹畅博士曾在2023中国计算机大会上表示,DPU是衔接计算和网络两大领域的重要枢纽,云、网、算协同,通过资源的深度感知与一体化编排,可以实现算力发现和跨域互通,打通数据与计算节点的通路。DPU作为网络和计算的衔接点,可解决数据传输的“最后一米”问题。通过DPU可以实现虚拟化层的全卸载和定制化的业务加速能力,具有更强的可编程能力。
对于未来中国联通研究院与中科驭数的合作,中国联通研究院唐雄燕院长也表达了三点期待:一是在谈到未来移动通信研究时,表达了借用DPU技术提供新的高效能硬件加速解决方案的期望。二是认为在引入DPU后,双方可以为联通包括云服务、超算服务等在内的服务体系提供差异化的服务,通过深度融合创新技术为用户提供更灵活、高效的服务。三是积极探索在算网融合技术的研发和推广应用,共建算力网络生态。
中国移动云能力中心刘军卫也在2023移动云大会中分享到,中国移动将助力打造国家级自主可控的高性能算力基础设施,通过布局国产化智算生态、共建自主GPU+DPU产业联盟、联创高性能网络技术三大举措,带动国产化智算产业成熟发展,抓住云计算技术定义权,引领云计算市场下一个黄金十年。到2024年,打通DPU、GPU、HPN三大单元,面向大模型场景打造一套全栈自主可控的系统。
二、中科驭数DPU技术开放日解决方案相关简介
10:00-10:05 | 开场致辞 |
10:05-10:20 | 高性能云原生底座方案 三尺青锋怀天下,一骑白马开吴疆 为IaaS服务安装DPU加速引擎 本方案使用支持RDMA协议的DPU卡代替传统网卡,将RDMA网络应用于并行文件系统,用RDMA高性能网络替代传统TCP/IP网络。基于RDMA协议零拷贝、内核旁路的特性,大幅降低并行文件系统在数据读写,数据传输的时延,提高带宽利用率,进而提升并行文件系统整体性能。同时利用DPU卡上的VirtIO-FS技术,将业务侧host的虚拟化功能卸载至DPU,减少host端CPU的算力损耗。 |
10:20-10:45 | 基于DPU的极速服务网格方案 服务网格化繁为简,为云原生业务提供极致时延体验 本方案将服务网格的sidecar容器集中卸载到DPU卡上执行,可以显著降低服务器CPU的算力消耗。同时,DPU卡对容器网络CNI进行了硬件卸载,高性能转发引擎实现了网络转发功能的加速,从而能够有效降低业务时延。该方案支持和原生Istio的无缝对接,对用户业务无侵入,可以实现业务的平滑迁移。 |
10:45-11:00 | 高性能国产密码卸载方案 自主研发加解密引擎,助力安全业务高效运营 本方案通过自主研发的加解密算力引擎,将加密协议、密码算法完全卸载到DPU卡上,突破传统VPN产品的加解密性能瓶颈,充分释放主机CPU资源,可以适用于国产化服务器平台;支持可编程转发引擎,实现非VPN场景用户对指定报文的加解密运算;支持TRNG、SM国密算法及国际算法,满足国家商密认证技术要求;支持防火墙访问控制功能,为每台服务器提供分布式贴身隔离防护,助力安全业务高效运营。 |
11:00-11:15 | RDMA加速并行文件系统解决方案 RDMA网络DPU卡,解锁存算高速通道 本方案使用支持RDMA协议的DPU卡代替传统网卡,将RDMA网络应用于并行文件系统,用RDMA高性能网络替代传统TCP/IP网络。基于RDMA协议零拷贝、内核旁路的特性,大幅降低并行文件系统在数据读写,数据传输的时延,提高带宽利用率,进而提升并行文件系统整体性能。同时利用DPU卡上的VirtIO-FS技术,将业务侧host的虚拟化功能卸载至DPU,减少host端CPU的算力损耗。 |
11:15-11:30 | 证券期货交易信创低时延网络解决方案 异构加速 技术创新 自主安全 时延领先 在证券期货交易领域,时延关乎收益。随着国内金融信创快速推进,国内金融机构对国产高性能、低时延网络方案,有着迫切的需求。 面向证券期货交易场景,中科驭数推出了信创低时延网络解决方案,基于自主研发并量产的低时延网络DPU卡KPU SWIFT-2200N和超低时延数据处理开发平台NDPP,搭配6大国产CPU构建低时延服务器,在系统层兼容各类国产操作系统,在应用层广泛适配多家业内金融软件厂商的交易系统,从而支撑核心交易业务从底层硬件到上层软件,向全信创平台迁移,同时还能获取媲美非信创的时延性能。 整体方案,在性能上达到国际领先的水平,完备的生态为业务提供端到端的保障,业内权威机构的认证评测让方案成为信创示范标杆,驭数的专业化交付运维和技术支持让客户创新无忧。 |
三、中科驭数企业基本情况
· 中科驭数是DPU新型算力基础设施领军企业
中科驭数专注于DPU芯片的研发设计,基于自研KPU芯片架构率先在国内进行了三代DPU芯片研发。自主研发的国际领先DPU芯片及系列产品,可以广泛应用于超低延迟网络、云和数据中心、金融计算、大数据处理、5G边缘计算、高性能计算等场景,助力算力成为数字时代的新生产力。
发展至今,中科驭数从芯片底层架构,到网络、存储、计算等上层应用系统,已形成深厚的核心技术积累,成长为DPU芯片细分领域内唯一的国家专精特新小巨人企业、国家高新技术企业、北京市知识产权试点单位,获得了多项国家级及省部级科技奖项。中科驭数牵头并参与了30余项行业标准及团队标准的制定,是DPU标准的重要推动者和参与者。
· 软硬协同发展的技术路线
DPU的研发基于软硬协同的自主研发技术。芯片设计的核心技术方面,中科驭数创新性地提出了软件定义加速器(Software Defined Accelerator)技术路线,自主开发敏捷异构KPU创新架构,解决DPU芯片设计碎片化的问题,具有软件定义可配置、低设计成本、计算高效的优势。在芯片软件生态方面,中科驭数自研的DPU软件开发平台HADOS,可兼容多种操作系统,大幅降低应用软件开发难度。
· 中科驭数芯片产品及解决方案布局
中科驭数基于DPU打造超低时延网络、云原生网络、智算网络三大方案,搭建了完善的应用生态,客户可覆盖云服务厂商、数据中心、运营商、证券基金、银行等数字经济领域企业。
· 中科驭数生态建设情况
基DPU软件开发平台HADOS,中科驭数全面拥抱国产化生态,已与国内6大CPU芯片、12家主流操作系统、9家主流数据库厂商、8家头部云/云原生厂商、17家TOP级服务器厂商完成兼容性适配。参与10大开源社区平台,共同推动技术发展
四、DPU技术发展背景
· DPU已被证明是支撑下一代数据中心IaaS及PaaS的重要基础设施
随着信息技术的持续发展,数据中心网络带宽从100G迈入400G,甚至将提升至800G或1.6T。然而,作为提供算力的物理载体,受限于通用CPU的结构的冯诺依曼瓶颈、摩尔定律逐渐失效等因素的影响,以CPU为网络核心的数据处理能力难以支持大规模新型数据中心的网络和数据的算力需求。在此背景下,DPU已经成为继CPU、GPU之后未来数据中心的第三颗主力芯片。
举例来说,如果将数据中心中的每一台服务器比喻为一座“城市”,在每个城市人口不断膨胀,城市间交互需求爆炸式增长的背景下,对比传统网卡,DPU帮助数据中心完成了从“乡间公路”到“高速铁路”的转变。DPU提供的高吞吐、低时延、基础设施卸载能力,帮助数据中心完美的规避了“信息孤岛”问题。未来的技术发展趋势将会是高度集成化的片上数据中心的模式(Data Center Infrastructure on a chip),即一个GPU、CPU、DPU共存的时代。
· DPU国内市场规模巨大
随着新一代信息技术发展、算力应用场景不断涌现,数据中心需求稳步提升,未来国内数据中心建设将继续加大。根据2023年《中国数据中心产业发展白皮书》,预计至 2025 年“十四五”规划期末,拟实现数据中心机架规模增长至 1400 万架,规模总量翻两倍,总增量投资约 7000 亿元。
按服务器规模预计,未来几年云与数据中心领域每年国内服务器出货量将维持在500万台左右,其中DPU渗透率在10%左右,单台服务器可以配置一块到多块DPU板卡,预计每年DPU需求量将在100万片左右。
· 政策密集出台,利好DPU产业发展
信创产业是数字经济、信息安全发展的基础。从国家层面的顶层设计、到地方发展规划,加快建设算力基础设施的各种重磅政策和方案接连出台,产业技术创新受到高度重视。国家十四五规划明确将“自主可控”列为制造强国战略的必要要求。与CPU、GPU芯片一样,当前国产自主网卡芯片的市场占有率极低。根据国务院印发的《新时期促进集成电路产业和软件产业高质量发展的若干政策》要求,中国芯片自给率要在2025年达到70%。
2023年10月,工信部、中央网信办、国务院国资委等六部门2023年10月联合印发《算力基础设施高质量发展行动计划》,提出到2025年,算力规模超过300 EFLOPS,并将数据处理器 (DPU) 设为重要任务之一。
评论