【坚守四核心】
Tegra 3是四核心(也可以说4+1),Tegra 4并未继续扩充,NVIDIA移动事业部高级副总裁Phil Carmack也在去年初就坦率地告诉媒体,四核心将是未来NVIDIA SoC的一个标准。
其实,四核心对于处理器来说是个不错的选择:核心和线程数量够多,足以应付多线程负载;每个核心可以单独开关,或者部分休息部分加速,也能很好地执行单线程负载;应用方面已经绰绰有余,核心再多纯属浪费;用户和宣传方面也足够好看了,再多可能就让人反感和质疑了。28nm新工艺和A15新架构加持之下,NVIDIA停留在四核心上是非常明智的。
Tegra 3的核心面积大约80平方毫米,Tegra 4塞入了晶体管,但感谢新工艺,面积稍大了一些但仍在80平方毫米这个档次上。
不过在台积电生产线上,28nm HPL工艺晶圆的成本显然要大大高于40nm LPG,更何况还有良品率问题,所以Tegra 4的成本必然高出不少,后果就是设备价格不会多低。
说实话,Tegra 4并不完全是那种震惊业界、引领时尚的芯片(除了首款四核心A15的名号),但综合来说却是NVIDIA的最佳选择,无论技术上还是商业上。
【Tegra 4/4i GPU架构】
这个话题之前曾经详细探讨过,这里就不再过于深入了,重点看看NVIDIA放出的一些新资料。
Tegra 4 GPU仍然是固定、分离的像素和顶点着色器设计,也是惟一一个没有采用统一着色器架构的现代移动GPU,看起来有些落伍,但仍然占用了不小的核心面积(10.5平方毫米),还有新的二级纹理缓存,用于改进带宽效率。
Tegra 4 GPU各方面都比上一代扩充了不少,总计拥有72个核心,包括48个像素核心、24个顶点核心。Tegra 4i将顶点核心砍去一半,只留下12个,像素核心则保留48个,总计为60个,不过Vec4像素单元从四个较小的变成两个较大的,每个负责领导24个核心。
Tegra 4 GPU最高频率提升到了672MHz,上代为520MHz,Tegra 4i则是660MHz。
T4 GPU像素、顶点单元分布
T4 GPU架构图
T4 GPU架构图
T4 GPU架构效率对比(官方数据仅供参考)
T4i GPU像素、顶点单元分布
T4i GPU架构图
T2/3/4架构图
T4 VS. T3
T4i VS. T3
最大的遗憾当属没有完整支持OpenGL ES 3.0,只是部分支持,比如多重渲染目标等等。这主要是因为Tegra 4GPU的像素着色器硬件浮点精度仍然是FP24,OpenGL ES 3.0则需要像素和顶点着色器都支持FP32。此外也没有ETC、FP纹理支持。
就目前而言,OpenGL ES 3.0支持与否并无太大实际意义,但不支持的话至少在规格上就输了一筹,而且这是大势所趋,一两年后等游戏大量使用它了Tegra 4就会很吃亏。
我们相信,NVIDIA完全有能力做一个支持OpenGL ES 3.0的GPU,但之所以选择不去支持,应该是出于核心面积控制方面的考虑。
【内存子系统】
Tegra前三代的内存带宽都小得尴尬,没法和苹果、三星、高通的比,人家都是双通道了。现在,Tegra 4配备了两个32-bit LPDDR3内存控制器,频率也提高到了1866MHz(未来还会提升),终于有了充足的带宽。
Tegra 4并未采用PoP一体封装,因此需要单独的外置DRAM内存颗粒,这显然会限制Tegra 4 PCB的布局,使之在小型设备里会有些局促。
不幸的是,Tegra 4i又成了单通道内存,但幸运的是会支持PoP和独立封装两种规格,其中前者频率最高1600MHz,后者最高1866+MHz。
【Tegra 4性能究竟如何?】
因为没有设备,这个谁也不好说,只能参考NVIDIA官方数据。以下来自一款1.9GHz Tegra 4参考平板。
CPU性能明显高于其它已知的任何ARM、Atom x86设备,GPU性能则宣称可与iPad 4媲美。
【Icera i500基带:软实力很重要】
如果说Tegra 4的故事是关于CPU、GPU架构的,Tegra 4i就是基带了。NVIDIA其实很早就认识到了基带的重要性,2011年收购了Icera,整合就是时间问题了,而且进展很快。
独立的基带芯片Icera i500是伴随Tegra 4发布的,Tegra 4i里整合的也是这个,只是去掉了USB界面,内存子系统也略有不同而已。
Icera的基带其实是很有趣的,架构上是在数字基带的基础上用软件定