专栏中心

EEPW首页 > 专栏 > 效率起飞!天翼云并行文件服务HPFS高效应对AI时代大模型训练存储挑战!

效率起飞!天翼云并行文件服务HPFS高效应对AI时代大模型训练存储挑战!

发布人:天翼云开发者 时间:2024-03-08 来源:工程师 发布文章

国内外AI大模型层出不穷,训练数据复杂程度更是呈指数级增加。如今,在万亿级参数时代,单个资源池已无法满足大模型训练场景中动辄PB级的数据存储量,对于企业来说,启用多个资源池构成的分布式存储势在必行。

image.png

为了应对AI大模型训练对数据存储的需求,天翼云推出并行文件服务HPFS(CT-HPFS,High Performance File Storage),旨在为AI时代提供高性能存储底座,助力企业构建基于云资源的、更高效的大型模型训练平台,实现大模型的连续训练。天翼云HPFS可通过分布式存储实现数据的并发读取,同时提供最高百万IOPS和百GBPS的吞吐能力,显著提升了数据的读取速度,从而大大提升GPU卡的利用率,为提升HPC和AI等场景的训练效率赋能。

天翼云HPFS为AI场景的数据训练提供高并发、低延时、高吞吐存储解决方案:

高并发

天翼云HPFS在保证文件一致性的前提下,将数据分布存储在多个节点上,通过分布式锁机制,实现多客户端同时对同一文件的不同部分进行读写,显著提升并发性能,单客户端的单流IO性能可提升200%以上,并发访问同一文件的性能提升300%以上。

 

image.png

低延迟

天翼云HPFS采用 RDMA(Remote Direct Memory Access,远程直接内存访问)技术,同时支持通过InfiniBand、RoCE和TCP/IP进行数据交互,大幅降低了网络传输的延迟,提高数据传输的效率,实现高速互联。

高吞吐

天翼云HPFS基于 NVMe 存储架构做出深度优化,能够充分释放SSD性能,显著提高了吞吐量等性能表现;基于并发传输通道的并行访问,增强了服务器处理高并发请求的能力。更重要的是,随着节点规模的增加,系统性能可实现线性增长。

基于多重优势能力,天翼云HPFS可为自动驾驶、智能客服、工业制造、基因测序、语音导航、AI训练等场景,提供高性能并行文件存储底座。


image.png

HPFS助力客户构建高速大模型训练平台


凭借卓越的技术实力,天翼云HPFS在“华彩杯”算力应用创新大赛中,荣获一等奖,代表着业界对天翼云HPFS创新能力的充分肯定。


image.png

作为云服务国家队,天翼云将继续坚持科技创新,以满足高性能计算场景存储需求为己任,不断提升产品的性能和可靠性,为客户打造高性能存储底座,持续为我国大模型产业发展提质增速。


专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: 大模型 云计算

相关推荐

云计算掀起智能硬件变革的浪潮

云计算驱动联想持续创新

Day0首发!海光DCU高效支持智谱GLM-5大模型

智能计算 2026-02-12

软件安全成为嵌入式云计算的热点

全球云计算市场迎来重大价格调整

2026-02-10

应用于数据中心(DataCenter)的 Smarter Solution

视频 2014-02-14

把大模型刻进芯片,可行吗?

智能计算 2026-03-02

前Qwen负责人林俊旸创业,目标融资规模为数亿美元

2026-05-14

打造可靠的云存储技术

BOE(京东方)蓝鲸显示大模型上线行业最强问答系统

Day-0支持|摩尔线程率先完成MiniMax M2.7大模型适配

2016物联网大会宣传片

“小显存,大模型”国数集联解读如何降低AI普惠门槛

台积电AI产能:英伟达的需求可能迫使实现翻倍

撤销交易!禁止外资收购Manus

2026-04-28

云计算掀起智能硬件变革的浪潮

云计算在IC设计中的应用

边缘计算与人工智能(Edge AI)如何引领新一轮技术革命

更多 培训课堂
更多 焦点
更多 视频

技术专区