高速电脑与高速运算技术 智能应用 影音
EVmember
Event

高速电脑与高速运算技术

  • DIGITIMES企划

美国田纳西州OAK Ridge实验室的泰坦超级电脑。OAK Ridge Lab
美国田纳西州OAK Ridge实验室的泰坦超级电脑。OAK Ridge Lab

从过去类似大型主机的超级电脑,到今日各国倾全力建造出成千上万个计算节点所连接的高效能计算(High Performance Computing;HPC)系统,其意义不仅只是争夺超级电脑的Top500排名),更可做为气象预测、汽车设计与碰撞模拟、3D影像动画处理,甚至军事上的口令分析?破解与核爆模拟等应用...

HPC发展——从单核、多核、丛集平行、虚拟到云端架构

大陆国家超级计算中心广州中心的天河2号,是截至目前为止全球最快的超级电脑。NSCC-GZ

大陆国家超级计算中心广州中心的天河2号,是截至目前为止全球最快的超级电脑。NSCC-GZ

美国能源部下重金打造Sierra、Summit超级电脑,誓言要在2017年夺回超级电脑王座。US DOE/IBM/NVIDIA

美国能源部下重金打造Sierra、Summit超级电脑,誓言要在2017年夺回超级电脑王座。US DOE/IBM/NVIDIA

早期超级电脑架构跟大型电脑(Mainframe)类似,是多人共享一个处理器?存储器运算系统的设计。1970年希穆尔•克雷创立克雷研究(Cray Research)公司,以矢量式处理器(Vector Processor)、环形等距线路设计出超级电脑(Super Computer),甩开新进竞争者廉价的纯量处理器架构而睥睨群雄,至今依然是主导超级电脑的霸主。

随后在80年代,把8?16个以上的电脑系统串连成为丛集化平行运算系统,成为超级电脑的设计主流;随着处理器走向核心精简指令化(RISC Core)、制程?时脉?快取存储器与核心数的提升,高速网络连接等丛集技术的发展,还有分散式运算兴起-藉由网际网络将广大的计算数据、分配给广大的PC以闲置计算资源运算,像是1999年SETI@HOME、2002年博克莱大学BOINC计划等的影响下,2000年代,HPC发展导入了网格运算(Grid Computing)、虚拟化(Virtualization)以及云端运算(Computing)的概念。

2010年代之后,应用于气象预测、物理模拟与国防用途的超级电脑,其建造上不再走纯的单一架构,而是由数千甚至上万个计算节点的相互连接(丛集平行化)、网络连接化,甚至是异质化架构(CPU+GPU)的配置,使得超级电脑也可以DIY-藉由日后计算节点的替换、升级,逐渐提升其整体运算能量,不必重新建造。

对一般高性能工作站、服务器用户而言,添置高效能图形显示卡?辅助运算处理器来加速浮点运算来建立一个桌上型HPC系统,甚至由三五好友、网络社群同好串连成群,进行比特币的挖矿(mining)等分散式运算架构HPC应用。

HPC高效能计算,不再由少数像Cray、IBM、HP等几家厂商所主导,CPU处理器?GPU图形芯片供应商,结合机架服务器、高速网络供应商一同进入、渗透这个市场。

以今日顶级桌上型电脑的处理器计算效能,约跟15年前的超级电脑相当,对英特尔(Intel)、超微(AMD)、甲骨文?昇阳(Oracle/SUN)与辉达(NVIDIA)而言,不仅是要争夺超级电脑的前500大排名(Top500)以做好行销宣传,一部丛集式超级电脑?HPC高效能计算系统,至少要使用到数千颗甚至上万颗高档处理器芯片,对于高端利基的服务器CPU市场可说是业绩的大补丸。

HPC?超级电脑的军备竞赛

以3D电影阿凡达(Avatar)来说,每秒浮点运算量高达205TeraFLOPs (TFLOPS),这是目前顶级Intel Core i7-5960X 8核处理器224GFLOPs尖峰运算量的915倍,因此建造HPC或超级电脑仍有其必要性。在2005年要列入全球前500大超级电脑排名,实测浮点运算能力至少需1.2TeraFLOPS,到2013年6月起门槛已经来到100TFLOPS。目前排名第一的大陆天河2号,其持续浮点运算能力高达33,867TFLOPS。

目前前500大超级电脑中,大陆占了61个,而美国占了231个。各国倾国家之力建造出以成千上万个机架式服务器?计算节点所连接的高效能计算(High Performance Computing;HPC)系统,不仅只是争夺500大排名的虚名,更为气候预测、天体物理模拟、分子模型理化模拟、汽车设计与碰撞模拟、3D影像动画处理,甚至国防上的口令分析?破解与可疑人事物的分析,带来进一步的应用。

2009年10月,由大陆国防科技大学研制的天河一号超级电脑在湖南长沙亮相,经升级后的天河一号二期系统(天河-1A),在2010年10月创下峰值、持续运算4,700、2,566万亿次浮点运算(TeraFLOPs;TFLOPS)的纪录,击败美国橡树岭国家实验室(OAK Ridge Lab)的美洲虎(Jaguar)超级电脑,成为当时世界第一快的超级电脑。

随后2011年6月,日本超级电脑「京」(K Computer)以每秒8,162TFLOPS的运算速度,把大陆天河一号挤下去拿到超级电脑的速度桂冠。

2011年10月美国橡树岭国家实验室(OAK Lab)宣布的美洲虎超级电脑进行升级计划,由美国能源部、国家海洋和大气管理局合资9,700万美元,委由克雷(Cray)公司操刀,使用18,688颗超微(AMD)16核Opteron 6274处理器,及辉达(NVIDIA) Tesla K20图形处理器所建造,这部升级过的超级电脑重新命名为泰坦(Titan)。其尖峰、持续效能值是27,112、17,952 TFLOPS,系统功耗为8,209千瓦,在2012年11月?2013年6月重新荣获全球超级电脑前500强第一的殊荣。后因2013年6月大陆天河2号的出现,目前仍居于第二名。

2013年,由大陆国防科技大学出资一亿美元,由浪潮集团来负责建造整合天河一号的后续机种-天河二号(Milkway-2)超级电脑,整套系统安置于国家高速计算中心广州中心。

天河二号做任务排程管理的前端处理器,采用大陆国防科技大学研制,40纳米制程的4,096颗的FT-1500 16核SPARC V9架构处理器,工作时脉1.8GHz,每颗设计功耗65瓦。

分配端的计算节点达16,000个,每个运算节点由两颗英特尔(Intel) 22纳米制程、Ivy-Bridge-EX架构的2.2GHz XEON E5-2692 12核处理器,搭配3颗8GB、1.1GHz XEON Phi31S1P协同处理器(57核)所组成,单一计算节点尖峰浮点效能值达1.003TFLOPS,整个天河二号理论尖峰、持续浮点运算效能值达到54,902、33,867TFLOPS,以近两倍效能把美国的泰坦(Titan)甩到脑后,从2013年6月、11月、2014年6月、11月的Top500排名都是第一,也是至今全球最快的超级电脑。

不过天河二号也引发了大陆关于其功耗、应用以及程序码撰写上的质疑声浪。像是整机功耗高达17,808千瓦,开启水冷散热系统后全系统运转功耗达到2,400万瓦,相当一个中小型城市的耗电量,也是目前TOP500里,功耗最大的;非全速运转模式下一年的电费达1亿人民币,全速运行的话更高达1.5亿。

台湾于1991年行政院核准成立国家实验研究院高速网络与计算中心(National Center for High-Performance Computing;NCHC),1992年进驻新竹科学园区,1993年正式对外提供高速计算服务。2003年正式转为财团法人并改为「国研院国网中心」。

目前国网中心新竹本部拥有一台全台湾最大运算能量的超级电脑-御风者(ALPS),是由宏碁集团所建造,具备尖峰、持续231.9、177.1 TFLOPS计算能力,曾囊获2011年6月TOP500超级电脑排名第42名,现为排名370名。

IBM因嗅到HPC市场商机,在2013年11月宣布与Google、Mellanox、辉达(NVIDIA)及泰安电脑(TYAN Computer)合组OpenPOWER联盟,积极开放自家的POWER微处理器架构相关平台技术,并且应用于高端服务器、网络系统、储存设备及绘图╱协同辅助处理器(GPU/CoProcessor)等领域的发展。

在2014年11月,IBM获得美国能源部(Department of Energy;DoE)的3.25亿美元订单,将为能源部建造开发两套全球最快的超级电脑-Sierra和Summit,并于2017年完成。前者将安置在美国田纳西州橡树岭国家实验室,主要用于民生与科学研究等用途;后者则放置在加州劳伦斯利福摩尔国家实验室,用于核武器模拟。

两部超级电脑将以超过 3,400个计算节点,每个节点至少40TFLOPS的浮点运算能力,整体浮点运算值将达到100?150/300PFLOPS,以超越大陆天河2号超级电脑2?6倍的尖峰计算能量为目标,为山姆大叔争回一些颜面。

关键字