▲TSMC的16nm FinFET工艺优势
对半导体芯片来说,升级工艺通常意味着晶体管性能提升、功耗下降,同时晶体管密度大幅提升。具体到TSMC的16nm工艺,该公司此前表示其16nm工艺的晶体管密度是28nm HPM工艺的2倍左右,同样的功耗下性能提升38%,同样的速度下功耗降低54%,对比20nm工艺则是20%速度提升、35%功耗下降。
我们再来看下GP100核心的相关数据:
▲GP100核心的晶体管密度、频率及TDP功耗
我们简单地把几款GPU的晶体管密度换算了下(晶体管数量除以核心面积,由于GPU核心的电路复杂,这种算法不一定精确,仅供参考),16nm工艺的GP100核心晶体管密度大约是2510万每平方毫米,算起来晶体管密度比之前28nm工艺的Maxwell、Kepler恰好多一倍。
至于每瓦性能比,这里使用的是FP32浮点性能与TDP功耗的比值,考虑到上述核心面向的市场不同,我们要知道侧重高性能的GP100与游戏市场的GM204、GK104对比TDP是不公平的,不过最终的结果依然显示出16nm工艺的GP100在每瓦性能比上有明显优势。
从这一点也可以猜测,未来针对游戏市场的Pascal核心(比如GP104、GP106)问世之后,它们势必要阉割掉GP100核心上很多不必要的功能,优化功耗,所以其每瓦性能比无疑会更出色。
Pascal架构看点之三:HBM 2显存登场,16GB很好很强大
早在2年前的GTC大会上,NVIDIA就公布了Pascal显卡的2大特色——一个是NVLink总线,一个就是3D Memory,号称容量、带宽是目前显卡的2-4倍,带宽可达1TB/s,这个显存实际上就是HBM 2显存。有意思的是,NVIDIA此举也意味着尽管AMD Fury显卡抢先使用HBM显存,但NVIDIA还是在新一代HBM显存上抢了先,不知道AMD面对这种情况又是如何看的呢?
对于HBM 2显存,我们之前也多次做过介绍,HBM 2显存现在已经被JEDEC吸纳为标准。相比第一代HBM显存,HBM 2显存IO位宽不变,但核心容量从2Gb提升到了8Gb,支持4Hi、8Hi堆栈,频率从1Gbps提升到了2Gbps,带宽从512GB/s提升到了1024GB/s,这也是TB/s带宽的由来。
目前三星、SK Hynix已经或者正在量产HBM 2显存,单颗容量是4GB的,NVIDIA的GTC大会上展示了SK Hynix的HBM 2显存,GP100核心使用的应该也是Hynix的产品,每个GP100核心周围堆栈了4颗HBM 2显存,总容量是16GB,要比AMD的Fury显卡的4GB HBM显存容量高得多。
支持HBM显存对NVIDIA来说还有个好处,那就是ECC校验。此前的架构中,NVIDIA Tesla显卡的ECC校验需要占用6.25%的显存空间,这意味着有相当部分的显存要被“浪费”,Tesla K40加速卡的12GB显存中有750MB预留给ECC校验,可用的内存容量就剩下11.25GB,而且这还会影响内存带宽。
相比之下,HBM 2显存原生支持ECC校验,不需要额外的内存占用,这不仅提高了显存利用率,带宽也不会受影响。
▲GTC大会展示的SK Hynix公司的4GB HBM2显存
16GB HBM2显存总量在Tesla及Quadro专业卡中不算第一,但HBM 2显存超高的带宽是GDDR5显存望尘莫及的。不过值得注意的是,在GTC大会上展示的HBM 2显存频率标明是2Gbps的,但NVIDIA的GP100核心目前带宽只有720GB/s,并没有达到之前宣称的TB/s带宽,算下来频率应该只有1.4Gbps左右,这说明GP100核心的HBM 2显存并没有全速运行,不清楚NVIDIA为何留了一手。
Pascal架构看点之四:NVLink可支持8路显卡并行
如果说3D显存是NVIDIA公布的Pascal的第一个关键特性,那么NV Link总线就是另外一个关键了,它同样是NVIDIA针对高性能运算开发的技术,号称速度是PCI-E总线的5-12倍,前面提到的DGX-1深度计算超级计算机就使用了NV Link技术。
▲GP100显卡背后的NV Link接口
NV Link的优点就是带宽超高,目前PCI-E 3.0 x16带宽不过16GB/s,用在游戏显卡上是足够的,但在超算中就不够看了,新一代的PCI-E 4.0规范又延期了,这就得靠NV Link总线了。NV Link实际上是NVIDIA与IBM合作开发的,每个通道的带宽是40GB/s,GP100核心支持4个NV Link,双向带宽高达160GB/s,而且带宽效率高达94%,这些都要比PCI-E总线更有优势。
▲DGX-1的8路GP100显卡并行就靠了NV Link技术
NV Link技术主要是为高性能运算而生的,IBM会在他们
本文来源:不详 作者:佚名