相对于上一代的高端GPU——GM204,GTX 1080的GP104核心所采用的Pascal架构的GP104笼统地看起来就像是一个加强版的GM204。同样是四个GPC,SM单元构成没有变化,每个SM依然包含128个CUDA核心,8个纹理单元。但是GP104的每个GPC里有5个SM,相比GM204增加了一组,这样一共就有2560个CUDA,或者叫做流处理器(SP)、160个纹理单元。需要注意的是,原本在GM204里叫做SMM的计算单元组,现在在GP104里改称TPC,它包含了重要的几何引擎Polymorph 4.0和CUDA单元簇SM。
此外,Pascal的显存控制器构成也与之前大相庭径,由8个接口组成256bit位宽,每个接口32bit,而之前4个64bit接口的模式沿用了多年。细心的读者会发现GM204与GP104的ROPs数量同为64个,但后者也分成了8组,与显存接口对应。该项细化赋予Pascal架构更灵活的存储资源调度能力,这与Pascal显存效能的提升息息相关。
相对于定位旗舰级的GTX 1080,这次我们拿到的微星GT72VR 6RD游戏本所搭载的移动版GTX 1060显卡和它的桌面版一样,看上去是GTX 1080的“对半劈”,但和之前的GTX 960不同,无论是移动版还是桌面版,GTX 1060的光栅单元(与分辨率输出性能息息相关)以及显存位宽并未直接砍掉一半,而是保留了3/4的ROP(48个),显存位宽也得以回归GTX 600系列的192bit,以保障GTX 1060的高分辨率和抗锯齿性能,整体来说要比之前的GTX 960要良心许多。
Pascal架构革新回顾:针对VR大力优化
从第一代支持DX11的核心架构Fermi开始,Polymorph就成为不可或缺的顶点建模指令引擎,一直伴随至今,DX11的标志性特效Tessellation(曲面细分)也是依靠它来实现。伴随着Pascal架构的到来,该GPU架构中Polymorph 4.0相比上一代Polymorph 3.0有着一个重大升级,那就是以更先进的“Simultaneous Multi-Projection”(同步多重投影)机制替代原先的Viewport Transform(视窗变形)机制,它能对现如今十分火爆的VR虚拟显示技术起到显著的性能和效果双重优化。
众所周知,VR虚拟现实应用对3D渲染性能要求极高,这跟我们用普通显示器玩游戏有很大差别。现实中人眼看世界不存在帧数这个概念,或者说帧数无限大,VR是虚拟现实,如果出现和现实逻辑冲突的现象就会产生强烈的不适感。因此,VR游戏需要很高的帧数。
一般来讲,VR图像要通过一个透镜传递到人眼里,原本矩形的画面只有中央位置的图像实际有效,所以要降低周边不必要的渲染,做出鱼眼效果来节省资源。但即便是之前的鱼眼效果,通过透镜后扭曲后仍然有一些边缘是无用的,SMP可以将这部分省略掉。
此外,SMP还可以通过新的算法来生成左右眼看到的图像,将其中大量的重复运算摘除,而不像之前各渲染一遍。这样综合来看,在VR应用中Pascal架构理论上拥有Maxwell双倍的效能。
Pascal架构革新回顾:软性能的优化
16nm FinFET工艺让Pascal架构GPU的核心频率突飞猛进,然而可喜的是它不但硬性能提高了,软性能优化也更上一层楼。
在运行3D程序时,流处理器资源会被指派分别运行渲染和计算两种工作,但是一个指令内完成它们所需的时间往往不一致,这就导致该指令完成前总有处理器会被闲置。动态负载平衡,顾名思义,可以随时将未完成的剩余工作分别到已完成工作的流处理器上,大幅提高核心资源利用率,节省了时间。
显存数据压缩可以提高存储空间利用率,增加数据传输速度。Pascal显存性能的提升不止在GDDR5X颗粒本身,还因为它能更高效地进行数据压缩。图像是由不同颜色构成的,颜色相似度越高的
本文来源:不详 作者:佚名