专栏中心

EEPW首页 > 专栏 > “翼”鸣惊人,天翼云两篇论文被ACM ICPP 2024收录!

“翼”鸣惊人,天翼云两篇论文被ACM ICPP 2024收录!

发布人:天翼云开发者 时间:2024-06-20 来源:工程师 发布文章
近日,由天翼云科技有限公司弹性计算产品线天玑实验室撰写的两篇论文《PheCon: Fine-Grained VM Consolidation with Nimble Resource Defragmentation in Public Cloud Platforms》及《Yggdrasil: Reducing Network I/O Tax with (CXL-Based) Distributed Shared Memory》被ACM International Conference on Parallel Processing(ICPP)收录

image.png

ACM ICPP是计算机体系结构、并行与分布计算、存储系统领域的顶级会议之一,也是世界上最古老的连续举办的并行计算国际会议之一。ACM ICPP收录论文均经过严格的同行双盲评审,近五年平均接收率为27.9%。此次天玑实验室两篇论文的成功收录,既是顶级权威机构对天翼云技术创新能力的认可,也是中国企业在国际学术舞台影响力日益增强的有力证明。


本次收录的两篇论文分别阐述了天翼云天玑实验室团队自主设计与研发的两大创新成果,包括面向大规模云数据中心管理的智能资源调度技术——PheCon,和基于“聚合计算”产品理念的面向新一代云计算基础设施的网络I/O加速技术——Yggdrasil。


PheCon:细粒度云数据中心

智能资源碎片整理算法


在云计算场景下,由于数据中心负载水平的波动性和需求的不确定性,各个物理服务器普遍存在资源碎片问题,造成数据中心资源浪费。如图1所示,客户需要紧急开通6台指定规格的云服务器,但集群内剩余资源只能满足4台云服务器,形成典型的资源碎片现象。如何应对资源扩容中常见的周期长、成本高等挑战,满足极端场景下的客户需求,成为亟需解决的难题。

image.png

image.png

图1. 碎片整理示意图


本论文创新性提出一种新型细粒度碎片整理算法——PheCon,通过云服务器二次调度的方式聚合集群内资源碎片,以满足更大规格资源的开通需求。同时,该论文还提出了基于分治思想的NUMA感知启发式算法和“诱导迁移”(Induced Migration)技术,通过规格填充、物理服务器选择、云服务器排序和NUMA调度,实现集群布局优化。


基于上述技术特点,PheCon可适配天翼云“2+4+31+X”的资源布局和异构数据中心的异构资源特点,做到一池一算、算无遗策,满足全域异构资源的二次调度,实现分钟级的快速碎片整理,提供优质的上云体验。目前,天玑智能调度平台稳定运行PheCon碎片整理功能,累计提供服务72次,每年节省运营成本超过千万元,减少碳排放超百吨。


Yggdrasil:CXL使能的无感

网络I/O性能加速


在通信密集型应用程序的运行过程中,基于Linux内核的操作系统网络通讯组件面临巨大的运行负担。为有效解决上述问题,本论文提出Yggdrasil网络通讯平替方案。


Yggdrasil是天翼云聚合计算团队预研的下一代数据中心网络通信技术。如图2所示,该技术可基于CXL共享内存实现用户态的高性能TCP/IP通信,且完全兼容现有的socket API,无需修改代码即可完成性能加速。天玑实验室团队通过模拟和真实CXL硬件进行评估的结果表明,Yggdrasil 可使Memcached的吞吐性能相比传统Linux socket高出8.2倍,并在不同消息大小的微基准测试中,将通讯延迟降低到传统方式的0.3%到4.1%。

image.png 

图2. 关于Yggdrasil快速/慢速通信路径示意图


Yggdrasil的性能优势与易用性主要得益于三个方面的设计优化:


(1)在跨主机通信中,Yggdrasil采用基于CXL的分布式共享内存(即快速通信路径)以提升性能,在CXL不可用的情况下,自动无感切换回传统socket(即慢速通信路径)。


(2)Yggdrasil依托于受信任的用户空间监控守护进程管理通讯连接控制平面操作,减少上下文切换开销。数据平面采用对等模型进行跨物理主机的进程间通信,充分利用CXL共享内存的性能优势。


(3)为弥补socket API和共享内存之间的语义鸿沟,采取多种技术兼顾接口兼容性和性能优势。


基于Yggdrasil的I/O网络性能优势及良好的API接口兼容性,Yggdrasil方案将在天翼云弹性计算产品线自主设计和研发的聚合计算平台进行落地,以减少网络I/O税,从而为客户提供更澎湃的算力资源,助力千行百业创造更多价值。


面向未来,天翼云将继续加强关键核心技术自主攻关,以领先的产品能力夯实数字基础设施底座,为千行百业数字化转型保驾护航。

专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: 云计算 弹性计算 ICPP

相关推荐

仿人型机器人能同时流利地说15种语言

消息称谷歌首款 AR 眼镜年内上市售卖,将在本周 I/O 大会发布

台积电AI产能:英伟达的需求可能迫使实现翻倍

云计算在IC设计中的应用

Upwind筹集2.5亿美元以实现云安全规模化

应用于数据中心(DataCenter)的 Smarter Solution

视频 2014-02-14

云计算驱动联想持续创新

云计算掀起智能硬件变革的浪潮

全球云计算市场迎来重大价格调整

2026-02-10

软件安全成为嵌入式云计算的热点

“英伟达亲儿子”CoreWeave提交IPO申请,去年收入暴涨8倍

智能计算 2025-03-04

2016物联网大会宣传片

云计算掀起智能硬件变革的浪潮

边缘计算与人工智能(Edge AI)如何引领新一轮技术革命

打造可靠的云存储技术

由Memfault驱动的Nordic nRF Cloud荣获移动突破奖所颁发之年度云计算创新奖

美图获阿里巴巴2.5亿美元战略投资,将在AI与电商领域深度合作

将AI工作负载推向边缘

更多 培训课堂
更多 焦点
更多 视频

技术专区