高性能计算:走向多核异构 面临能耗挑战
日前,2008年全国高性能计算学术年会在无锡举行。从本次年会上我们能了解到高性能计算技术的哪些流行和发展趋势?在高性能计算中又面临哪些障碍和挑战呢?本报记者对此进行了深度报道。
本文引用地址:https://www.eepw.com.cn/article/201609/304626.htm多核异构大势所趋编程模式是关键
多核和多核异构系统越来越受到超大规模计算机的青睐,如前不久发布的全球高性能计算TOP500排名第一的IBM的Roadrunner就是把自己的Cell和AMD的皓龙处理器混合在了一起;在芯片层面,包括英特尔、AMD和nVIDIA等都在研制异构多核或众核芯片。例如AMD提出的CPU+GPU的Fusion,nVIDIA的Tesla等。
众所周知,在当前的高性能计算系统和应用中,绝大多数是x86架构的处理器和应用,随着高性能计算系统性能的不断提升,多核和重核异构系统在满足高性能计算的某些特殊应用的时候表现出比较出色的性能。例如对于追求浮点运算性能的应用来说,GPU(图形处理芯片)的速度要远远高于传统的 CPU(中央处理器),这也是为何AMD和nVIDIA公司认为,在未来的高性能计算中GPU或者CPU+GPU会最终取代CPU。但从目前应用软件的编程模式来看,多数编程工具和应用仍然是基于x86架构,所以要想充分发挥出GPU或CPU+GPU的性能,改变传统的编程模式至关重要。对此,AMD公司中国区高级技术经理刘文卓在其《未来是CPU和GPU的融聚》的主题演讲中也承认,目前编程模式是多核异构系统面临的最大挑战。那么多核异构是否是高性能计算的发展方向呢?
英特尔公司高性能计算软件经理SanjayGoil博士对记者讲,英特尔一定会做异构的多核芯片,但与对手“异构的内核,异构的编程环境”不同,英特尔会坚持走“异构的内核,相同的编程环境”这样一条道路,也就是说,不管是哪种内核,所使用的编程模式都应该是一样的。虽然现在业界已经出现了一些异构系统,但这些异构系统除了在Linpack测试时有较出色的表现,在实际应用中并不好测试,因此需要强大的软件工具的支持,降低异构环境下的软件编程难度。
英特尔中国公司亚太客户响应团队技术经理何万青博士称,目前英特尔的高性能计算开发工具可用于分析和优化已有MPI编程模式的性能。同时英特尔也发布了自己的MPI2.0,接口不变,编程模式不变,但更加适合多核环境,在进程与内核之间可以实现更好的绑定。另外英特尔针对OpenMPI在与业界伙伴进行合作。
从对与会厂商的采访和目前高性能计算的现状看,基于相同编程模式的多核异构应该是未来高性能计算系统最切实可行的道路。而采用CPU+GPU的异构系统,改变业内流行的编程模式的难度很大。至于未来会怎样,充满了不确定性。
能耗是挑战技术寻求突破
在高性能计算领域,用户对于计算性能的需求是无止境的,这使得计算机系统的规模越做越大,系统功耗也成为超级计算机发展面临的重大挑战。
以中石油的计算处理中心为例,从2002年到2007年CPU从340颗增长到13308颗,增长了近40倍。其运算能力当初是189亿次/秒,现在高达 139万亿次/秒,短短5年间处理能力获得了质的飞跃。正是因为有了强大的计算能力,处理中心在冀东南堡油田的发现过程中发挥了至关重要的的作用,为油井位置的选择提供了重要的依据。据统计,2005年处理中心有1500个CPU时,电费是334万元;2006年CPU增加到2300颗,电费达到492万元;2008年电费至少需要1500万-1700万元。
除了处理器之外,内存及其功耗的增加也值得关注。随着制造工艺的改进,内存容量越来越大,速度越来越快,价格越来越低,与CPU一起推动了计算能力的快速增长。但与此同时,我们也要为之付出更多的电费。现在主流的DDR2和FBD内存均已达到10W这个量级,以至于我们不得不为内存的散热感到头痛;其次是芯片组和外围设备,由于CPU和内存频率不断提高,这就要求和它们配合的芯片组、总线和外围设备在更高的频率下工作,以充分发挥性能,而更高的频率意味着更多的电能消耗。对此,国家并行计算机工程技术研究中心、中国工程院院士金怡濂告诉记者,系统功耗是超级计算机发展面临的重要挑战,当今全球百万亿次级超级计算机系统功耗在1000千瓦左右。一台千万亿次超级计算机系统的功耗能达到数兆瓦,每年的电费开销高达数千万元。因此,未来的超级计算机必须在节能方面有新的技术突破。
此外,Gartner预言,在接下来的几年里,世界上一半左右的数据中心将受电力和空间的约束,能耗会占到一个IT部门预算的1/3。IDC也表示,IT 组织能耗的花费将达到硬件花费的1/4。以往高性能必然高功耗的时代已经过去,评价高性能计算系统的优劣要看性能,更要关注能效。
鉴于此,目前许多厂商已经将降低高性能计算系统的能耗和绿色计算作为努力的方向。例如处在高性能计算产业链上游的处理器厂商英特尔就在制程工艺上采用了最新的45纳米技术,这不仅从晶体管层面解决了漏电问题,而且还可以让芯片做得更小,性能更高,这使得45纳米产品可以用较少的时间完成相同的任务,从而减少能源的消耗。
另外,英特尔也在芯片中不断增强能源管理功能,如对能耗按需管理,把不忙的处理器核的功耗降低,以便提升繁忙的处理器核的主频。而在基础架构方面,英特尔认为一定要和整个产业的伙伴进行共同合作才能让整个生态系统共同走向绿色计算。
个人HPC呼之欲出应用价格决定市场
特别值得一提的是,在此次年会上,个人高性能计算机也受到了广泛关注。中国科学技术大学陈国 良 院 士 在 大 会 上 做 了《PHPC:一种普及型高性能计算机》的报告。他指出,高性能计算的一个发展方向是可扩展系统,当前主要是研究千万亿次计算的关键技术;而另一个发展方向就是普及型系统,他们为此提出了称为PHPC(PersonalHighPerformanceComputer)的个人高性能计算机技术。
其实,近年来个人高性能计算机一直是计算机领域的热点,随着计算机在生产和工作中被广泛应用,人们对计算能力的要求也越来越高。但现有机架式和刀片服务器主要瞄准的是大型客户,从性价比角度分析,中小规模应用并非其强项,而且其适用性和易用性也不能满足大量中小企业用户的需求。
由于制造工艺的改善和多核技术的使用,CPU的处理能力现在已经达到一个相当高的水平。随着四核的普及,一个双路系统即拥有八个内核的单台服务器的处理能力得到极大提高。互联技术也在迅速发展,万兆以太网、Infiniband、PCI-ESwitch的大量应用使CPU能充分发挥强大的计算能力,很多以前需要几十台服务器的应用如今在几台机器上运行可以了。技术的发展和市场的需求呼唤新的产品,也就是所谓的个人高性能计算机,这个概念很早就被提出来了,但直到最近市场上才出现真正的产品,例如,Tyan的台风系列,Vxtech的PersonalClus-ter。
评论