要衡量不同显卡之间的性能,必须有统一的测试标准。这个标准就是由第三方发布的软件。在OpenGL领域,Quake3和Doom3的霸主地位是难以撼动的,而DX领域内是百家争鸣。3D Mark系列自然是一支不可或缺的力量。随着3D Mark 05的发布,这一测试包再次引起了全球的关注。
3D Mark历史回顾
● 3D Mark99 Max
3D Mark99 Max是Madonion.com首款显卡测试软件,但是它的影响力相当有限,一方面当时的显卡只作为CPU处理的助手,对系统整体性能的影响不如现在大,另外当时的测试霸主是3D Winbench和Quake系列。3D Mark99 Max主要考察固定功能顶点转换和光照能力及显卡的多材质填充能力。
● 3D Mark2000——初露锋芒
3D Mark2000的问世令用户为之耳目一新,在此之前,3D显卡的测试是件费力的事,可用的软件也只停留在一些老式的软件:比如3D Winbench系列或者是Quake2。3D Mark2000所处的时代是DX7时代。与DX6相比,DX7的显卡整合了“硬件光照与移 动引擎”,大大提高了画面的质量,并减轻了CPU的负担。从DX7开始,显卡逐渐具备独立的运算能力,开始向日后的GPU发展。
3D Mark2000共有两个游戏,每个游戏进行低中高分辨率的测试,还有两个CPU测试。3D Mark2000给显卡评测带来的是前所未有的视觉冲击和便利。正是凭借这款DX7测试软件,Madonion.com开始为人所知。
● 3D Mark2001/SE——如日中天
3D Mark2001/SE是Madonion.com历史上最经典的测试软件,为什么这么说呢?因为至今Futuremark仍然提供3D Mark2001/SE成绩的Online Result Browser服务(ORB)。同时,3D Mark2001/SE的成绩仍然在被不断刷新。
3D Mark2001/SE的3D Mark成绩由四个游戏,共七个场景的成绩得出。前三个游戏共六个场景均是基于DX7,最后的Mother Nature场景则是完全的DX8场景。完全基于硬件的Pixel Shader和Vertex Shader,只有符合DX8标准的显卡才能跑完全部测试。
Madonion.com的初衷是将3D Mark2001/SE打造成显卡测试的工具。不过可能是无心插柳,实际测试中,CPU对最终成绩的影响非常大,结果CPU和显卡共同影响了3D Mark2001SE的成绩。这与3D Mark2001/SE的起点不高有关:大部分场景基于DX7,对于DX8甚至是DX9的显卡来说,获得的负担很轻。真正的速度瓶颈在于CPU的建模速度。3D Mark2001/SE更多的反映了一台机器的CPU,显卡以及内存等系统综合性能,而不仅仅是显卡。
● 3D Mark 03——树大招风
3D Mark2001/SE的成功使得Madonion.com和3D Mark的名声大噪,3D Mark几乎成了划分显卡档次的惟一标志。在3D Mark03诞生之前,Madonion.com更名为FutureMark,完成了商业化改造。肩负着业界的无限期待,3D Mark 03面世了。但未曾料到的是,发布伊始,3D Mark 03便遭受了巨大的非议,最强烈的指责来自NVIDIA:在实际应用中不分伯仲的GeForce 4 Ti 4600与ATi RADEON 9700Pro,在3D Mark03中的得分差距令人瞠目结舌。此外,FutureMark在设置上令人费解的偏袒也使得人们怀疑FutureMark与ATi、NVIDIA之间的错综复杂的利益关系。
困扰3D Mark 03的另一个问题是厂商在驱动上做的手脚。因为树大招风,NVIDIA和ATi都在驱动中或多或少为3D Mark03进行了“优化”,提高显卡的得分。这样导致了3D Mark 03的权威性荡然无存。3D Mark 03也渐渐失去了头上的光环,受到评测机构媒体的冷落。
3D Mark 03的成绩仍然是由游戏场景的成绩综合得到。3D Mark 03是一款完全由DX9 API编写的软件,没有采用前作采用的MAX-PAYNE引擎。第一个场景是DX7场景,第二第三个场景是DX8.1游戏,采用了SM1.1/1.3/1.4技术。第四个场景是Mother Nature 2则是CG画质版的DX9场景,采用了SM2.0。大多数DX9显卡都无法流畅运行这个场景。
3D Mark 05——如期而至
● 3D Mark 05的系统要求
什么样的配置才能运行3D Mark 05呢?
这是FutureMark推荐的最低配置:
★至少2GHz的X86处理器
★512MB的系统内存
★400MB的硬盘空间
★符合DX9的显卡,至少SM2.0或更高
★Windows 2000或Windows XP操作系统
★DX 9.0c或更高
3D Mark 05对系统的要求是相当高的,特别是显卡。因为它拒所有DX8级别的显卡于门外。从目前掌握的资料看,NVIDIA中可以运行的起步显卡是GeForce FX5200,ATi为RADEON 9600SE(RADEON 9500也可运行,但是ATi的命名方式并不能反映出R9500与R9600SE之间的差距。)
●3D Mark 05的主界面:
主界面与3D Mark 03类似,如果是注册版,那么可以选择特定的测试项目,“Setting”里可以选择分辨率,反锯齿,过滤模式以及SM的版本。
选择测试项目
3D Mark 05由四部分构成:Game test,CPU Test,3D Feature Test和Batch Size Test。其中Game Test的成绩经处理后生成3D Mark。
3D Mark 05 score = (Game Test 1 × Game Test 2 × Game Test 3)^0.33 × 250
三个场景的得分在3D Mark 05中的权重是一样的,而不像3D Mark 03那样最后三个场景占的比重特别大。
● Shader Mode2
全部采用Shader Mode2是3D Mark 05的最大特征。这意味着只有DX9级别的显卡才能运行3D Mark 05,昔日的王者Ti系列将被3D Mark 05彻底拒之门外。
在Direct X中,Shader共有两种:Vertex Shader和Pixel Shader。DX9开始,Shader的版本升级到了2.0(被称为SM2.0)。SM2.0极大扩展了Shader的使用范围和灵活性。SM2.0可以执行更长和更复杂的指令。SM2.0加入了利用浮点数值进行计算的能力。这对提高画质非常重要:在实时计算并形成画面的光照计算中,浮点格式的数据占据了统治地位。SM不必再依赖近似计算。SM2.0引入了更高级的Shader语言,并在此基础上尽可能的兼容原有的Shader语言。
针对不同GPU采用的不同的架构,DX9可以支持不同的Shader版本,最新的DX9.0c可以支持SM2.0、2.0a、2.0b以及3.0,目前只有GeForce 6800和6600才支持SM3.0。3D Mark 05广泛使用了SM2.0,并且能够依据硬件所能运行的最高版本来确定渲染时采用的模式;当然,用户也可以手工选择Shader的版本。
● 3D引擎
3D Mark 03之前,Madonion.com一直使用MAX-FX引擎进行Demo的制作。从3D Mark 03起,这一做法发生了改变。由于Shader技术的采用,3D Mark 03将大部分工作直接交由API和图形卡来完成,引擎所做的工作就是将Shader语言载入Shader。3D Mark 05进一步强化了这种做法,所以3D Mark 05引擎使系统承担的负荷比3D Mark 03更重。
● 游戏测试
游戏测试一直是3D Mark测试的重头戏,每代3D Mark游戏的画面都在提高,从这点我们就能看到3D技术的发展。
Game1:Return to Proxycon
游戏场景测试
Return to Proxycon是3D Mark 03中的第二个游戏——Battle of Proxycon——的延续。故事的背景仍然在太空。一艘装满贵重货物的飞船遇到了太空海盗,一场激战在所难免。Return to Proxycon中的激烈战斗场面丝毫不亚于Doom3。Return to Proxycon展示的精美画面也是前所未有的。这个场景只是整个游戏中的一部分,在3D Mark 05的Demo中,你可以看到完整的过程。这个场景中共使用了8个光源,包括2个指向光源和2个静态光源,采用的纹理尺寸达到了2048×2048。
测试结果
在这个场景类似Doom3的游戏中,成绩的排列也与Doom3类似。NVIDIA的显卡占据较为明显的优势,即使是6800GT也能小胜X800XT。不过在上代显卡的较量中,由于管线上的先天劣势,FX系列完败。
Game2:Firefly Forest
游戏场景测试
满月的夜晚,月光倾泻在森林中,萤火虫自由地穿梭其间,俨然是森林的主人。这就是Firefly Forest场景。
场景中地面材质的处理与Game1类似,但增加了漫反射效果。岩石由金属材质光泽的贴图构成,场景采用了高细节的几何模型,以及大气散射和雾化效果。场景中月光采用了指向光源,动态阴影的纹理尺寸同样达到了2048×2048。而萤火虫采用了512×512尺寸的纹理。
测试结果
6800系列和X800系列的性能旗鼓相当、不分伯仲。6800 U击败了X800XT,但同为12条管线的X800 Pro击败了6800标准版。5950Ultra不及9600Pro的成绩再次反映出了NV35在架构设计上的失误。
Game3:Canyon Flight
游戏场景测试
第三个场景叙述的是一艘在峡谷中飞行的船与守卫这个峡谷的海怪之间的激烈战斗。完整的故事情节可以在3D Mark 05的Demo中看到。由于需要做出水面反射峡谷的效果,这个室外的大范围场景是非常复杂的。水和天空的处理都大量使用了雾化效果:这样可以依稀看到水中潜行的海怪。
这个场景中对岩石的处理堪称是3D Mark 05中对系统负担最重的部分之一。PS2.0需要始终参与直至完成动态阴影渲染,而水面的效果必须经过6次渲染才能实现正确的反射和散射效果。
光源使用方面因为是晴天,只需太阳一个光源即可。这个场景对显卡的动态阴影实现能力是个巨大的挑战:因为场景的跨度太大,根据Futuremark的说法,即使进行两次2048×2048纹理操作仍然不够。
第三个场景只使用了一个光源,所以速度也是三个场景中最快的。第三个场景是ATi与NVIDIA的旗舰显卡较量中惟一获胜的地方。X800Pro依然远高于6800标准版。
测试结果
CPU Test
CPU Test从3D Mark2000开始便被引入了,属于“传统测试项目”。CPU测试仍然沿用前面几个场景中的游戏,只是将分辨率降低,并且Vertex Shader全部交由CPU完成。这样可以尽量减少显卡的工作量而将CPU的负荷提到最大。
CPU score = (CPU Test 1 × CPU Test 2)^0.5 × 1500
在3D Mark 05中,CPU Test使用的是Game3场景和Game1场景(按照先后顺序)。在Game3场景的测试中,CPU不仅要承担Vertex Shader的工作,还要计算飞船在峡谷中飞行的航迹。为了确保在不同系统中承担的计算量是相同的,飞船飞行的航迹是相同的。
CPU Test1中使用了D Lite算法,这是一种较为先进的算法,主要考虑了未来可能的虚拟或者物理多核心处理器,可以同时让CPU进行最多两个线程的处理。
CPU Test2使用了2帧/秒的固定渲染模式,不过没有加入AI(人工智能)处理。
● 3D Features Test
这部分的成绩虽然不计入3D Mark的最终成绩,但可以反映出显卡自身处理速度,因为它们都是一些纯理论上的速度测试,而在其他的测试软件中较少见到。我们重点介绍Pixel Shader和Vertex Shader测试。
Pixel Shader
材质最复杂的测试是Game3 Test,所以它被单独列出进行Pixel Shader的测试。测试反应的是阳光照射下的岩石,填充这样一个场景的速度是很快的,同时也非常依赖显存带宽。
Vertex Shader
3D Mark05的Vertex Shader测试分为简单和复杂两种模式,简单模式下,只有一个光源照射在6个海怪的模型上,每个海怪模型大约有100万个顶点,因此工作量是相当大的。3D Mark05已经全面转向了Shader Model2,但即使是Vertex Shader1也可以很好地完成这个测试。
材质测试
复杂模式下的Vertex Shader测试表现的是一大片草地,每根草的表面材质和弯曲程度都是独立的,与真实的草地非常类似。草的摆动都是由CPU计算的,但软件对其进行了优化以保证尽可能地减少CPU的差异而造成的影响,更多的体现显卡自身的Vertex Shader计算能力。在画面中,草离镜头较远,这使得近距离欣赏草成为一件不舒服的事,但这可以摆脱填充率对性能的影响。
材质测试
● 块状测试
块状测试(Batch Test)
块状测试是3D Mark 05中新增加的测试项目,它的内容是对一个未经过优化的非常简单的场景进行渲染测试,旨在针对目前驱动中的一个弱点。几年来,游戏开发者始终是对尽可能大尺寸的“块(Batch)”渲染,不过,在实际应用中,针对小尺寸的块状渲染不仅能获得同样的效果,也能取得很快的速度。这个测试早在3D Mark2001时就被提出了,而到了2005,更多的开发组成员提出加入这一测试。这个测试共有6种模式,每个块由128层128×182尺寸的正方形组成,包含了8、32、512、2048、32768个三角形 。
块状测试
在今天的显卡驱动一般会对最后两个“块”的测试进行优化,块的尺寸越小(包含的三角形数目越少),渲染的速度越慢。所以这个测试从某种程度上说是对驱动渲染能力的考验。
测试结果
Online Result Browser
Online Result Browser(简称ORB)服务是FutureMark提供的最有特色的服务。当用户将自己的测试结果上传到FutureMark的服务器后,系统会自动与其他人上传的成绩进行比较。不过登录ORB系统有一个前提,即必须有3D Mark得分。ORB的排行榜也是目前竞争最激烈的超频排行榜,因为从3D Mark2001到3D Mark 05,ORB服务均处于开放服务。
综合得分