新闻中心

EEPW首页 > 嵌入式系统 > 业界动态 > 揭秘太湖之光:纯国产如何称雄TOP500?

揭秘太湖之光:纯国产如何称雄TOP500?

作者:时间:2016-07-18来源:电子工程网收藏
编者按:一路走来,质疑之声也从未间断,但无论怎样,每一项技术创新都会有学习的过程,不怕起步晚、走弯路、困难多,有了完全自主的技术支持,太湖之“光”将让中国超算更加闪耀。

  第1篇:界的角斗场:TOP500是什么?

本文引用地址:http://www.eepw.com.cn/article/201607/294145.htm

  1946年,由美国军方定制的电子计算机“ENIAC”面世,当时的这个“大家伙”每秒可执行5000次加法或400次乘法运算。经过了70年的发展,的运行速度已经达到亿亿次/秒级别。在今年6月的ISC 2016上,TOP500公布了新一届世界冠军:神威·。有人不禁会问,这款究竟有何能力超过天河二号?国产处理器申威26010,又是怎样的秘密武器?


揭秘太湖之光:纯国产如何称雄TOP500?


  神威·

  超算界的角斗场:TOP500

  自1993年以来,国际TOP500组织每年都会按照Linpack测试性能公布全球已部署的前500台超算,每年会有两次排名,旨在促进超算领域的交流和合作,推广应用。由于在2002年之前,中国HPC(高性能计算)未曾向国际申报过Linpack结果,因此没有被列入TOP500。后来,随着相关机构陆续开放测试,中国开始在国际超算市场崭露头角,迅速成为前10名的常客。

  Linpack最早在1974年4月被使用,是当前最流行的用于测试高性能计算机系统浮点性能的基准,通过超算求解N元一次稠密线性代数方程组的方式做出评估。Linpack测试包括Linpack100、Linpack1000和HPL。其中,HPL被称为高度并行计算基准测试,是针对现代并行计算机提出的测试方式,应用范围更广。

  计算峰值是衡量计算机性能的一个重要指标,所谓的浮点计算峰值分为理论值和实测值,前者是计算机理论上每秒能完成浮点计算的最大次数,主要由CPU主频决定,后者是Linpack测试值,即在计算机上运行Linpack测试程序,通过一系列调校得到的最优测试结果。

  在德国法兰克福举行的第47届国际超算大会上,一串带有中国特色的英文“TaiHuLight”成了全场焦点,它的官方名称是“神威·”。这款超算以93Petaflops的Linpack峰值性能力压天河二号,领跑TOP500,与它一起出名的,还有国产处理器申威26010。值得一提的是,中国上榜的HPC数量(167台)也首次超过了美国(165台)。


揭秘太湖之光:纯国产如何称雄TOP500?


  太湖之光登顶TOP500

  除了排在前两位的太湖之光和天河二号,第四至十名的超算依次为泰坦、Sequoia红杉、日本K京、Mira、Trinity、Piz Daint、Hazel Hen和Shaheen II。根据官方的说法,中国是继美国、日本之后,全球第三个采用自主CPU建成千万亿级别超级计算机的国家。

  作为曾经的TOP500六冠王,这里也有必要提一下天河二号,其由国防科大研发,落户在广州超算中心,搭载英特尔Xeon处理器,运行的是基于Linux的麒麟系统,创新性地采用了异构融合体系结构。天河二号的计算节点能耗约为18兆瓦,加上散热系统的整体能耗在20兆瓦以上。

  第2篇:太湖之光首秀夺冠 软硬件实现国产化

  初识“太湖之光”

  事实上,今年的ISC并非是神威家族的首秀,2011年曾经有一个神威蓝光系统,被安装在济南的国家超级计算中心,当时在TOP500上排名第14,所使用的申威SW1600是第三代16核芯片。上线五年之后,在863计划的支持下,中国国家并行计算机工程技术国家研究中心(NRCPC)推出了更强大的申威SW26010处理器,帮助太湖之光夺取了冠军。

  太湖之光搭载申威26010众核处理器,运行速度超过10亿亿次/秒,峰值性能12.54亿亿次/秒,持续性能达到9.3亿亿次/秒,功耗比达到每瓦特60.51亿次运算。与天河二号相比,持续计算速度提升了近3倍,测试功耗却更低(15371KW,天河二号为17808KW)。在Linpack测试中,太湖之光用4个小时就完成了天河二号20多个小时才能完成的运算任务。


揭秘太湖之光:纯国产如何称雄TOP500?


  申威26010处理器,主板为双节点(图片来自Jack Dongarra)

  太湖之光的整机效率达到74.16%,相比之下泰坦为65.19%、天河二号为55.83%,这在性能愈强、规模愈大的情况下,是很不容易的。性能功耗比方面,太湖之光的成绩为6G/W,泰坦为2.143G/W,天河二号为1.95G/W。此外,太湖之光在Green500也跻身三甲,考虑到排在前两位的超算搭载的是低功耗英特尔E5,因此这一成绩值得肯定。

  整体来看,太湖之光的架构应该是沿用了蓝光的MPP(大规模并行处理)分布式方案,更符合传统的HPC应用,效率更高。太湖之光由40个计算机柜组成,每个机柜有4个SuperNode(256个节点组成),共拥有40960个节点,每个节点单CPU有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GB DDR3-2133。


揭秘太湖之光:纯国产如何称雄TOP500?


  太湖之光机柜组成(图片来自Jack Dongarra)


上一页 1 2 3 4 下一页

关键词: 太湖之光 超算

评论


技术专区

关闭