天下网吧 >> 网吧天地 >> 网吧行业 >> 网络追踪 >> 正文

英伟达Tegra K1深度解读:技术很牛

2014-1-10不详佚名
:英伟达Tegra K1深度解读:技术很牛

1月10日消息,在今年的CES展上,Nvidia为我们带来了Tegra系列移动芯片当中的最新成员——Tegra K1。这款芯片将会把Nvidia苦苦挣扎的移动处理器业务和更为成功的桌面显卡部门联合在一起。

根据Nvidia的说法,Tegra K1将会为移动设备带来“下一代家用机的游戏图形性能”,但功耗仅有2W。Nvidia是如何办到这一切的呢?科技网站Android Authority日前就撰文对Tegra K1进行了深度介绍。文章内容如下:

大量的CUDA核心

Tegra K1总共拥有192个显卡处理核心(Tegra 4为72个),这无疑是这款芯片的一大亮点。显卡的“血统”要比核心数量更为重要,而在这一点上,Tegra K1也没有让我们失望。不同于Tegra 4,Nvidia直接把Kepler架构用在了Tegra K1身上,让后者和GTX 680,Titan和780Ti这些桌面显卡站在了同一水平线上。

虽然Nvidia并没有对Tegra K1的Kepler架构进行多少改动,但把它和上面这些顶级桌面显卡放在一起比较的确有点不公平。Tegra K1只有单独一个Nvidia SMX单元,其中包含了192个CUDA核心,8个纹理单元,4个光栅处理单元,这和Nvidia的顶级显卡系列相比明显少了很多。就拿GTX 680为例,这款显卡拥有1536个CUDA核心,128个纹理单元,32个光栅处理单元。

Nvidia并未提及Tegra K1核心的时钟频率或者是带宽,但在CES的展示当中,他们的确给出了Tegra K1的着色器性能峰值:365 GFLOPS。目前还很难去测算这款芯片的实际性能,但我们还是可以进行一些比较。比如说,定位低端的OEM版本GT630拥有192个CUDA核心,其着色器性能峰值为336 GFLOPS。

比较应该已经足够了,那么Nvidia是如何把这一切放进一枚功耗仅有2W的芯片当中的呢?

从彼此独立的芯片转向单独一枚SoC会带来节能性上的明显提升,而大幅缩减核心和光栅处理单元的数量也得以让Tegra K1的功耗能够低于Nvidia的Kepler笔记本芯片系列(已经在20W以下了)。更大的128KB L2缓存也降低了消耗在片外存储器访问上的能源。

对于效率管理能耗的低级别优化也应该被给予特别的关注。门控电源和门控时钟会快速识别出闲置的GPU核心,并降低时钟频率或者是彻底封闭这些区块,以此达到降低功耗的目的。对于ASTC纹理压缩的支持也会帮助降低UI和3D渲染的工作量。

无论是从图形性能还是节能性上面,Tegra K1都是巨大的进步。但并非所有的提升都来自于硬件部分。

下一代API

要说在移动设备上提供下一代游戏体验这方面,Tegra K1最显著的新功能就是全面的图形API支持了。也许你还记得,Tegra 4并不支持OpenGL、CUDA和DirectX 11这些常见的API,只是对部分游戏进行了优化,这还要取决于开发者。Tegra K1在这方面得到了改善,带来了对于OpenGL 4.4,微软DirectX 11.2,OpenGL ES 3.0和Nvidia自家CUDA 6的全面支持。

新的API自然也带来了图形性能上的新提升,比如对于FXAA和TXAA抗锯齿和Nvidia PhysX物理加速引擎的支持,还有Compute Shaders所带来的一整套高级特效(比如环境光遮蔽)。Tegra K1同时也是市面上首款支持硬件曲面细分的移动显卡,不过高通正在开发的Adreno 420同样也会具备该功能。

这所带来的好消息就是,PC和家用机游戏的开发者现在可以把自己的作品进行压缩,然后放到移动设备上让Tegra K1运行。考虑到这款芯片的性能据称是要强过PlayStation 3和Xbox 360,所以跨平台移植也不是没有可能。Nvidia在展会现场已经展示了Unreal Engine 4、《英雄萨姆3》和《三位一体2》的移植版,Tegra K1运行起来毫无问题。

两种CPU设计

Tegra K1共有两种CPU版本,针脚设计完全兼容,这也就意味着厂商可以轻松在两者之间进行互换。第一种是我们所熟悉的四核+Cortex A15排布,架构和Tegra 4几乎完全相同。而第二种加入了Nvidia自己的双核ARM CPU

和Tegra 4一样,Tegra K1的CPU共有4个满速A15核心,用于处理繁重任务,额外的一个低性能A15“附属核心”就负责一些简单任务。每一个核心还可以被封闭以降低能耗,只有在需要时,额外的核心才会开启。但K1和Tegra 4之间有一个细微的差别,那就是前者的CPU是基于新的第三版ARM Cortex A15核心设计。

第三版Cortex A15主要对门控时钟进行了封闭,从而达到了提升节能性的目的。转换到28nm HPM制程工艺也进一步降低了能耗,Nvidia也将时钟速度提升了20%,从1.9GHz提高到了2.3GHz。

Tegra K1的A15处理器也要比Tegra 4的稍快一些,但提升程度并没有Kepler显卡那样大。但是,这种久经考验的四核设计意味着Nvidia可以很快开始Tegra K1的生产,OEM厂商预计会在本季度收到供货。

而代号为“Denver”的第二种CPU设计就完全不同了。Nvidia彻底放弃了附属核心这种设计,而选择了更加传统的双核配置。这两个核心基于新的ARMv8架构,同时支持64位和32位。Denver的最高时钟频率锁定在2.5GHz,同时具备更大的128KB L1指令缓存和64KB L1数据缓存。不过遗憾的是,目前有关Denver的信息还非常有限,不过Nvidia放弃流行的四核设计而选择双核的举动值得玩味。

丰富的多媒体功能

本文来源:不详 作者:佚名

声明
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。文章是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 Email:support@txwb.com,系统开号,技术支持,服务联系微信:_WX_1_本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧·网吧天下
  • 本周热门
  • 本月热门
  • 阅读排行