▲申威SW26010处理器是260核心
这次的太湖之光的神威SW26010处理器也是江南所研发的,虽然大家猜测它还是Alpha指令集,但跟龙芯后续架构类似,申威SW26010的架构、指令集已经远远超出了之前的范畴,加入了很多新指令。这次的SW26010就是260核心众核架构,乱序执行架构,频率1.45GHz,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。
与其他国产处理器相比,申威系在性能上完全走在了前列,在世界范围内都是靠前的,SW26010的理论浮点性能高达3TFLOPS,其性能完全可与Inel最新的Xeon Phi加速卡一拼。不过申威处理器的不足之处在于内存系统,太湖之光性能达到天河2号三倍的同时总内存反而从1.4PB降低到了1.31PB,每个节点使用了四路128bit DDR3-2133内存,带宽为136GB/s,这一点上不如Intel的Xeon Phi加速卡,后者自身集成了16GB eDRAM缓存,带宽超过500GB/s,而且早就支持DDR4内存了。
再来说下飞腾,天津飞腾研发的FT系列处理器也在HPC领域有过应用,不过飞腾FT处理器用的架构更杂乱,从公开资料来看第一代FT处理器兼容于Intel安腾2指令集,第二代FT-64处理器在银河计算机中有过使用,第三代产品FT-1000则是基于开源的UltraSPARC架构,8核64线程,在天河1号计算机的节点网络上有使用。
之后的FT-1500还是基于SPARC架构,制程工艺从65nm升级到了40nm,16核心128线程,在天河2号超算中使用了4096颗FT-1500处理器作为节点前端处理器。
最新的FT-1500A虽然名字跟上面的类似,但实际上没什么关系了,因为它的架构变成了ARM 64位,使用的是28nm工艺。据天津飞腾总经理谷虹介绍,FT-1500A系列处理器是64位通用CPU,兼容ARM V8指令集,采用国际先进的28nm工艺流片,具有高性能、低功耗等特点,关键技术国内领先,可实现对Intel中高端“至强”服务器芯片的替代,并广泛应用于政府办公和金融、税务等各行业信息化系统之中。
不论是申威还是飞腾,这两家军方背景的国产处理器单位因为目标明确,可以说是国产处理器中做的最成功的——不论性能还是架构设计都有独特之处,申威处理器不仅有硬件研发,还在编译器及Linux操作系统(神威睿思)上做了创新,太湖之光这次有三项应用入围戈登贝尔奖,这也得归功于江南所在超算应用上的努力。
·中晟宏芯:借力蓝色巨人IBM,Power架构能撑起一片天?
通用处理器架构也曾百花齐放,Intel当年面对的对手比现在多得多,但X86现在差不多一统天下了,能跟Intel竞争的公司就更少了,强大如IBM这样拥有Power架构的公司也不行了,他们索性于2013年联合NVIDIA、泰安电脑等公司成立OpenPower开放联盟,其他公司也可以获得Power架构授权。此后在2014年还推动成立中国POWER技术产业生态联盟,IBM与多家中国公司签署了授权协议,中晟宏芯就是其中的一家。
IBM的Power架构一度成为国产处理器的希望
中晟宏芯成立于2013年,发起人是江苏梦兰集团、江苏中晟智源、苏州高新创业投资集团,梦兰集团之前我们说过是中科院旗下的公司,而后两者可以说是江苏政府代表,因此中晟宏芯获得Power架构技术得到了工信部及江苏政府、中科院计算所的支持,计算所甚至派了一个技术团队,如果一切都能按照预定的引进、消化、吸收,中晟宏芯应该在2019年推出国产化的Power处理器。
但是事与愿违,中晟宏芯虽然很快就推出了CP1处理器,但这只是IBM Power 8处理器的马甲而已,还没等这家公司消化Power技术,他们就闹出了欠薪风波,中科院派出的技术人员发不出工资,此后公司也不断动荡,股东发生变化,人员也波动频繁,指望中晟宏芯推动Power架构国产化是没希望了。
此外,IBM的Power架构在国内银行等关键行业有重要应用,而且Power处理器性能强劲,是个好东西,但真要引进消化也没这么容易,以Power 8架构为例,它是12核心96线程,核心面积达到了650mm2,复杂度远高于普通处理器,再加上原本使用的是IBM自己的22nm SOI工艺,而SOI工艺已经没多少代工厂搞了(GlobalFoundries用过,28nm节点放弃,后来又继承了IBM的衣钵),这无疑增加了Power处理器的国产化难度。
·兆芯/海光:中国能用X86技术打败Intel、AMD?
前面提到的国产处理器中,除了军方背景的申威、飞腾之外,基于MIPS、SPARC以及Power架构的处理器发展过程都是一波三折,他们面临的核心问题也是一样的——软件生态远不如X86。既然大家都能注意到这个问题,那中国为什么不直接选择X86体系呢?这是个好问题,你还别说,国内还真有搞X86架构的。
国内较早跟X86架构授权有关的是北大微电子中心,2005年AMD跟中国政府达成了协议,科技部指定北大微电子中心接收AMD Geode-2处理器技术授权,北大微电子中心还把这事作为重点宣传,表示“这是美国历史上,第一次向在美国境外授权开发X86兼容的微处理器及系统芯片。此次合作也是迄今为止中美半导体领域最具影响力的技术合作。”
AMD给的这个处理器是X86架构的,中国因此获得了X86技术,不过Geode处理器大部分人是没听说过的吧,因为这是AMD嵌入式处理器,其最初起源于Cyrix公司的MeidaGX平台,后来Cyrix这部分业务被国家半导体(NS)收购,2003年AMD又把国家半导体的Geode业务收了。
AMD授权给北大的X86技术显然不可能是最顶级的,所以选了嵌入式架构给中国,不过这点“施舍”已经可以让北大好好装一下了,很多人恐怕不记得还有北大众志处理器吧,原先也是做MIPS架构,得到AMD授权之后,他们的PKUnity86-3就是X86兼容处理器,但最后也是不了了之,也只活在了展台上,现在都没什么消息了。
说得有点远了,回到正题上来。由于X86架构是AMD、Intel吃饭的家伙,他们通常是没可能把技术授权给别人的,AMD之前那个例子更多地是拿买来的技术迎合中国市场而已,中国公司从这两家获得X86技术的可能性几乎没了。不过我们别忘了X86技术实际上并非只有AMD和Intel,VIA威盛公司也有X86授权的,他们的技术来源于Cyrix,后者又是Intel当年对外授权X86技术的几家公司之一。
本文来源:不详 作者:佚名