就在中国的最新型超级计算机“神威·太湖之光”(以下简称“太湖之光”)前不久赶超中国蝉联六届TOP500全球超算冠军的“天河二号”,成为全球运算速度最快的超级计算机(以下简称超算),全世界就对中国这一“神秘机器”充满高度关注与好奇,坊间还传出各种各样有关国家超级计算无锡中心(以下简称无锡超算中心)以及它拥有的“太湖之光”的传闻,国内外超算业界与媒体也在不断通过公开与私下的渠道搜集着“太湖之光”的点滴新闻。到底这个神秘的“超级运算巨无霸”什么样?而拥有这一超级机器的“机窝”(业内对于超算中心的昵称)又是什么样呢?《环球时报》记者几经联系,日前终于走进全球最强超算——“太湖之光”的“机窝”无锡超算中心一探究竟。
全球最强“机窝”的低调程度超乎想象
很多人可能认为运营着全球最强超算的无锡超算中心一定非常高大上,但《环球时报》记者从无锡高铁站下车之后,几乎横穿了整个无锡市,才在无锡西南方向一个并不是很起眼的科技园区内找到无锡超算中心的所在地。而它所在的大楼也非常低调,门口并没有摆放或挂设任何表明身份的标识,只是在大堂正中墙壁上挂着的一个液晶屏上显示:国家超级计算无锡中心欢迎您。而在液晶屏的右侧是一个需要指纹开锁才能进入的玻璃门,上面写着国家超级计算无锡中心,后来记者才知道这就是通往“太湖之光”机房的大门。而在保持低调的同时,这个国家级第六大超算中心的简朴程度也让《环球时报》记者大吃一惊。在乘坐电梯前往无锡超算中心当家人杨广文主任的办公室时,记者看到电梯厢体上的保护材料还没有拆除,而杨广文办公用的转椅底座上竟然还保留着出厂时的塑料泡沫。
谈起无锡超算中心的成立,杨广文的自豪之情溢于言表。据他介绍,“十二五”期间,科技部支持了两个十亿亿次级的超算项目,其中一个是先期启动的“天河二号”项目,而后在2014年,“太湖之光”也在科技部正式立项,2014年底就已完成原型机的验证,而在2015年底就已经完成“太湖之光”系统的研制与组装。由于当时科技部的要求是建“全球一流的超级计算机和全球一流的超算中心”,所以在超算研制完成的同时,超算中心也就成立了。
用两年左右的时间就能研制出世界第一的超算,这个速度是不是太惊人了?杨广文回应称,“太湖之光”的具体研制时间虽然短,但它之前经过了很长时间的技术预研。它采用的是国家“核高基”重点科技专项支持的由国家高性能集成电路设计中心通过自主核心技术开发的全国产“申威”CPU。“申威”系列的技术路线比较明晰而稳定,而且采用上一代“申威”CPU的“神威蓝光”超算为“太湖之光”的发展做了很好的铺垫和尝试。没有它,“太湖之光”也就不会那么快研制出来。
那这个世界一流的“机窝”又有哪些优势呢?杨广文表示,因为当时中国最高水平的超算“天河二号”采用的是美国英特尔公司的“至强”处理器,所以国家希望能采用另一种技术路线来研制新的超算,从布局之初的思路就是要打造拥有全国产架构、自主可控软硬件的新超算,因此无锡超算中心最大的优势就是拥有全部自主的核心技术,还有一个优势就是“太湖之光”从原型机研制阶段就开始与应用方一起讨论互动,否则也不可能在首次夺得TOP500冠军时,就有三大应用入围世界高性能计算应用最高奖——“戈登贝尔”奖提名,而此时距离“太湖之光”完成研制还不到半年时间。
零距离探访“太湖之光”
随后《环球时报》记者被允许进入无锡超算中心最核心的区域——“太湖之光”的机房。所有进入机房区域的人员都必须穿上防尘鞋套,墙壁上到处贴着禁止拍照摄像的标识。不过,据杨广文介绍,这些都是在今年6月TOP500榜单发布之前贴出来的,因为当时“太湖之光”还处于严格保密阶段,6月20日机器发布后,整个无锡超算中心无论对于国内外同行,还是有意合作的应用方,都抱着一种开放的态度。记者在整个采访过程中也深刻体会到这一点,记者采访时,还遇到广州番禺区的代表正在进行参观,据介绍,“天河二号”所在的广州超算中心就位于番禺区。记者还目睹了好几拨外国的专家与相关企业到这里寻求合作。
在机房外面,以实物形式展示了“太湖之光”采用的申威众核处理器,单个处理器看起来非常小巧,大概就是一个相机SD存储卡那么大,但它所蕴藏的运算潜力以及全部国产的技术含金量,不亚于一块钻石,而正是这一个个小钻石排列在一起构成了“太湖之光”峰值运算速度每秒12.54亿亿次、持续计算速度每秒9.3亿亿次的全球最强运算能力。走进机房内部,首先映入《环球时报》记者眼帘的是三组巨大的机柜,中间一组机柜的正面用中文写着巨大的神威太湖之光,在每个机舱上也用中文与拼音写着这一名字。而在机箱的上部边缘还有着不断闪烁的LED光条,这些光条总体上是蓝色的,但每隔几秒会出现红色、绿色或者黄色光条的快速律动。《环球时报》记者提出“这些光条颜色的变化是代表超算的运算状态吗?”,杨广文表示,这和超算的运算状态完全没有关系,只是为了展示一种比较神秘的科技感效果。
据杨广文介绍,该机房的面积约1000平方米,三组机柜是以0、1、0的顺序摆放,其中两个“0”是由每组20个机舱组成的运算设备,中间的“1”是由8个机舱构成的网络设备(用来实现处理单元的互联互通),一共加起来是48个机舱。记者提出,机柜之所以以“0、1、0”的顺序摆放是不是因为计算机的代码就是由0和1组成的,杨广文说,主要是这方面的考虑,当然也同时考虑空间的充分利用和布局的整体效果。
工作人员随机打开一个机舱,看起来很像一个宽体式家用双开门冰箱,而里面排列着密密麻麻的运算单元则很像抽拉式档案柜。据介绍,每个机舱里面有4组超节点,每组超节点有32块运算插件板,每个插件板上有8个CPU,而这8个
本文来源:不详 作者:佚名