我们之前已经对RTX 40 SUPER家族中的RTX 4070 SUPER与RTX 4070 Ti SUPER两款GPU进行过全面的测试,而这次我们要测试的则是三张新卡中的旗舰,NVIDIA GeForce RTX 4080 SUPER Founders Edition GPU。与其他两款GPU规格上的突飞猛进相比,RTX 4080 SUPER在规格上的提升很难称得上是惊艳,但是MSRP也从RTX 4080的9499元降价到8099元,在性价比方面显著提升。同时,随着支持DLSS 3技术的游戏与应用愈发普遍,相信有很多仍然在使用Ampere甚至更老GPU架构的玩家们正在考虑是否升级手中的GPU,我们这次也会用上代的对应卡型 – NVIDIA GeForce RTX 3080 Ti FE进行对比。为RTX 40 SUPER收尾的4080表现究竟如何?不妨让我们一起来看看吧。
房间中的大象:完整的AD103-400核心
要讨论RTX 4080 SUPER,绕不开的就是它搭载的完整AD103核心,具体编号AD103-400。与之前RTX 4080所采用的AD103-300核心对比,AD103-400核心的规模更大,SM单元从76组提升到80组,CUDA核心数也破万来到10240个,第三代光追加速处理器和第四代Tensor Core AI加速核心也分别提升到80个和320个,分别拥有121 TFLOPS与836 AI FLOPS算力。同时,在频率标定上,NVIDIA GeForce RTX 4080 SUPER Founders Edition的默认频率为2295MHz,Boost频率为2550MHz,整卡功耗标定320W。
而在显存与缓存上,RTX 4080 SUPER继承了RTX 40系家族的设计,采用了64MB的大容量L2缓存搭配256位16GB GDDR6X显存的设计,通过架构层面的革新实现了极其高效的显存等效带宽,在高负载的现代图形应用,尤其是开启了光线追踪的游戏与生产力应用中能够带来极为可观的性能提升,这一点在后面也会进行测试。
而为了测试这张搭载了完整AD103核心的新卡的性能表现,我们也是用上了一套旗舰级的配置,接下来的测试也全部会用这套配置完成。
在3Dmark的传统光栅渲染测试中,我们可以看到与上一代的RTX 3080 Ti相比,本次RTX 4080 SUPER的性能在测试的几个项目中都有相当可观的提升,即使是提升幅度最低的Fire Strike,一个1080P下使用DX11 API的测试,从RTX 3080 Ti升级到RTX 4080 SUPER也能带来34.3%的性能提升,而Fire Strike Ultra(4K,DX11)、Time Spy(2K,DX12)和Time Spy Extreme(4K,DX12)这三个高分辨率、使用现代图形API的高负载性能测试的提升幅度更是全部突破40%。考虑到RTX 3080 Ti基本就是RTX 3090砍掉一半显存容量的产物,搭载了Ampere GeForce卡中最大的GA102核心,这样的提升幅度更是令人咋舌。
在两项光线追踪性能测试中,我们也看到了类似的提升。凭借着80组新一代光追加速器,NVIDIA GeForce RTX 4080 SUPER Founders Edition在两项光线追踪性能测试中带来了类似幅度的性能提升。Speed Way的提升幅度有39.3%,而Port Royal则带来了42.3%的提升。整体来看,与上一代RTX 3080 Ti相比,本次NVIDIA GeForce RTX 4080 SUPER Founders Edition的性能提升整体来到了40%左右。考虑到上述所有测试都基于标准渲染管线进行,没有引入DLSS,这样的性能提升还是十分可观的。
外观与包装箱
NVIDIA GeForce RTX 4080 SUPER Founders Edition的外包装箱与之前的NVIDIA GeForce RTX 4070 SUPER Founders Edition一样,基于RTX 40系的Founders Edition包装改进而来,在左下角加上了一个SUPER字样。
打开包装箱,我们可以看到NVIDIA GeForce RTX 4080 SUPER Founders Edition的本体躺在中间,四周的放射式装饰线条契合这代GPU的Slogan-速度穿越。
在外观上,原先黑色的X字中框现在也同样被涂成了黑色,左侧的RTX 4080 与浮雕SUPER字样也不用多说。应该说,自从RTX 30系以来,NVIDIA在GeForce RTX Founders Edition上的设计都相当耐看,且能够很好地“等比缩放”,无论是双槽还是三槽都十分优雅。
当然,既然说到这里,我们也自然涉及到NVIDIA GeForce RTX 4080 SUPER Founders Edition的散热系统了。与大部分AIC厂商的设计不同,NVIDIA的FE版GPU散热设计采用前后双风扇的设计,辅以大量的热管、散热鳍片与均热管,能够带来相当可观的解热能力。同时,背部的金属面板与风扇不仅起到装饰作用,还能够在机箱中提升整体风道的散热效果。
使用FurMark进行30分钟的烤机,GPU能够稳定在320W的标称功耗,最热点也只有73摄氏度。考虑到风扇转速只有40%左右,这样的性能表现仍然是十分优秀的。
在3Dmark Speed Way压力测试中,我们也对它的帧率稳定性进行了测试,成绩相当不错。同时,根据监控数据,我们还可以得知这张NVIDIA GeForce RTX 4080 SUPER Founders Edition在测试中GPU最高能够跑到2730MHz,频率还是比较高的。
GPU的顶部除了色调由浅变深之外仍然保持了RTX 40系Founders Edition的一贯传统,供电也同样由一个12VHPWR接口提供。当然,对于电源并不带有这一接口的用户们来说,NVIDIA也在包装盒中提供了对应的转接线缆。
NVIDIA GeForce RTX 4080 SUPER Founders Edition提供了三个DP 1.4a与一个HDMI 2.1接口,同时在挡板处大挖孔为气流提供了足够的通道,这也有助于散热器进一步提升性能表现。
DLSS 3.5、NVIDIA Reflex与游戏性能测试
当我们聊到RTX 40系GPU时,一个老生常谈的话题就是NVIDIA的全套游戏技术栈。完整AD103-400核心搭载了320组第四代Tensor Cores与80组第三代光追单元,搭配NVIDIA独占的DLSS和RTX生态,在4K游戏中能够带来相当可观的性能表现。
DLSS 3在搭配Ada架构先进的实时光线追踪硬件加速器的前提下能够允许玩家在游戏中体验更具临场感的游戏体验,也同样允许创作者在设计时就以更先进的光线技术栈为基础进行打造,实现更加精妙的艺术设计。它实现实时帧生成的技术核心在于其GPU核心中首次加入的硬件光流加速器。这项技术允许GPU实时分析前后帧并计算出光流场,即用于描述像素移动的数学算法。
以此为基础,配合从游戏引擎中直接获取的几何信息(如地理位置、运动向量、速度和深度等),GPU就能够在现有的DLSS 2与光栅渲染管线的基础上无中生有地生成新的游戏帧。由于DLSS 3技术的管线完全独立运行,这意味着它与游戏渲染管线中的其他部分不会互相影响,性能表现也同样能够得到保证,甚至在CPU性能受限的情况下也是如此。在极限情况下,玩家显示器上只有12.5%的像素是由图形渲染管线渲染,剩下的87.5%全部来自DLSS管线,但在视觉上也仍然难以与原生渲染分辨。
3Dmark也提供了一套DLSS 3的理论性能测试,我们在DLSS 质量档位分别测试了2K与4K分辨率下GPU的性能表现。可以看到,无论是在2K还是在4K分辨率下,开启/关闭DLSS后都能带来相当程度的提升,幅度都在200%以上。尽管基准测试无法完全反应在具体游戏中的实际提升,我们也仍然对接下来的游戏性能测试颇具信心。
而随着支持NVIDIA RTX技术的游戏与应用于2023年底突破500款大关,DLSS 3.5光线重建技术也开始推向市场。通过使用AI工具对游戏渲染管线输出的帧进行统一降噪,并使用与DLSS 3相比扩充五倍的数据量训练的超级模型,DLSS 3.5技术加持下的游戏与工作站应用能够同时实现更真实的画面表现与更流畅的性能体验。最重要的是,由于它仅仅是在光线追踪与DLSS管线上进行拓展,并不依赖DLSS 3所使用的帧生成管线,使用RTX 20系Turing GPU或RTX 30系Ampere GPU的玩家们也可以在自己的RTX GPU上启动DLSS 3.5光线重建技术,体验极富沉浸感的画面效果。
以这对从《赛博朋克:2077》码头酒吧中截取的对比图为例,可以看到,在开启光线重建之后,无论是远处酒保身上衣物的折痕、底部灯具打光在立柱的木头纹理上的反射还是近处作为背景板的三瓶酒水颈部的装饰,在光线重建技术的加持下实现了更具真实感的效果。同时,屏幕中央左侧的高脚酒杯中液体反射的光线在关闭光线重建时充斥着噪点,但在开启光线重构后反而相当清晰。可以看出,光线重建技术能够显著提升玩家在这座逐梦之城里的代入感。
而在性能方面,由于我们采用了相当极端的光线追踪:超速预设,可以看到在原生渲染时即使性能相当强劲的NVIDIA GeForce RTX 4080 SUPER Founders Edition也仍然败下阵来,只有15帧的平均帧,延迟也接近120毫秒,但DLSS 3.5光线重建技术带来的性能提升也同样相当显著,平均帧来到了50帧,1% Low帧与延迟也有了相当程度的优化,这甚至比我们在前面使用3Dmark的DLSS 3性能测试得到的性能增幅还要爆表,这也是DLSS 3.5带来的一项性能优势:由于使用统一降噪器来代替各种独立降噪器,在如《赛博朋克2077》这样的充斥着各种灯效的赛博朋克风游戏中,DLSS 3.5光线重建不仅能够实现画面效果的提升,还能够进一步降低GPU负载,提升游戏帧数表现。
而在另外一款DLSS 3.5游戏《心灵杀手2》中,我们也能够通过对比图看到类似的细节。在光线重建技术的加持下,手电筒光线近距离照向养老院房间内部的摇椅、较远处的木制壁炉的细节都更符合真实光线带来的效果,萨迦安德森的倒影反射在墙壁与织物上也更加真实。同时,左下角茶几上的书籍的锯齿显著减少,阴影也没有关闭光线重建时那么生硬。对于《心灵杀手2》这款极度依赖环境构建带来的心理恐怖构建游戏体验的作品来说,毫无疑问DLSS 3.5光线重建技术能够带来相当显著的游戏体验提升。
当然,与顶级的叙事手法一道的,是《心灵杀手2》激进的图形技术栈。为了实现顶级的画面效果,Remedy在心灵杀手2中引入了大量激进的图形技术栈,包括原生针对DLSS 3.5光线重建设计的光照管线、全景光线追踪等,这也使得这款游戏对GPU性能的要求甚至比《赛博朋克2077》还要激进。同时,心灵杀手2的故事发生在现代的美国小镇,且题材并不忌讳各种血肉纷飞的地狱景象,游戏场景的丰富程度与光线反射的复杂程度远非2077年经过重建、相对规整的夜之城可比。其结果就是即使我们使用NVIDIA GeForce RTX 4080 SUPER Founders Edition这样的高性能GPU,在4K分辨率、双高预设的前提下原生渲染帧数也仅有8帧。然而,当我们开启DLSS 3.5光线重建,游戏的平均帧数瞬间提到82帧,1% Low帧也来到了51帧,相当可玩了。对比并不支持DLSS帧生成的RTX 3080 Ti的性能,我们可以得出结论,DLSS 3.5光线重建技术尽管主要目标并不是提升游戏性能,但随着游戏场景、光照的复杂度提升,启动这一技术带来的性能加成也会同步提升,相当有趣。
随着农历新年的假期的来到,相信很多玩家们会用新GPU与朋友们在各种多人游戏中一同拼杀。而在《战锤40K:暗潮》中,玩家们不仅可以享受战锤40K世界观下各种武备,扮演审判庭特工消灭帝国的敌人,还能够使用DLSS 3技术搭配NVIDIA GeForce RTX 4080 SUPER Founders Edition实现相当可观的高分高刷高画质光追游戏体验。
可以看到,在开启DLSS 3质量档之后,玩家们在最高画质下也能够体验100帧以上的平均帧数,稍微降低一下画质实现4K120甚至4K 144都相当轻松。同时,我们也可以看到系统延迟从79.1ms显著降低到41.9ms,这就得益于DLSS 3绑定的NVIDIA Reflex技术了。
NVIDIA Reflex是一项包含 GPU 和 G-SYNC 显示器,以及可测量和降低竞技游戏延迟(也就是从点击到显示之间的延迟)的软件技术的全套低延迟游戏解决方案。通过对系统整体图形渲染管线的优化,它可以有效降低计算机系统内部的渲染延迟,对于游戏玩家来说能够带来极强的竞争力。同时,由于DLSS 3需要将新增加的游戏帧以符合逻辑的方式插入游戏画面中,画面时长的可预期性就变得极为重要,这就让NVIDIA Reflex技术的范围更加扩展。当然,在前面我们已经展示过NVIDIA Reflex技术如何在启用DLSS 3的游戏中提升性能表现,而在电竞游戏中,这项技术也有得到广泛运用。
例如,传奇的FPS网游《反恐精英》的直接续作《反恐精英2》中,我们就能够在设置菜单中看到NVIDIA Reflex的选项,可以自行启用以在游戏中实现极低的延迟表现。
可以看到,在开启Reflex技术后,我们可以将《反恐精英2》的系统延迟降低到20ms以内,对玩家在激烈战斗中的胜率提升可以说十分显著。
AIGC与生产力应用
当然,从 NVIDIA G80一统流处理器架构并推出初版CUDA SDK 1.0到对深度学习具有里程碑意义的、运行在GTX 580 GPU上的AlexNet,在2024年的我们看来,GPU除了用于游戏、视频编解码这些传统的3D和图形需求之外,作为生产力工具和AI训练器也是一把好手。而NVIDIA GeForce RTX 4080 SUPER Founders Edition搭载的10240个CUDA核心在这些使用场景里自然也相当给力。
例如,在著名的Stable Diffusion AI画图应用中,用户可以使用TensorRT工具加速图片生成的速度,即使在数据量更大的Stable Diffusion XL模型下也是如此。用户只需要在Stable Diffusion中导入TensorRT拓展包,并基于Checkpoint进行加速引擎的训练就可以使用。
NVIDIA GeForce RTX 4080 SUPER Founders Edition在AI生成方面相当给力。在不使用TensorRT进行传统CUDA计算的情况下,生成10张图片只花费105.9秒,与RTX 3080 Ti的256.3秒相比提升242%,相当显著;而开启TensorRT加速之后,时间比更是来到了115.3比64.1,性能提升65%。搭配16GB大容量显存以及标准三槽尺寸,NVIDIA GeForce RTX 4080 SUPER Founders Edition是一张相当适合专业级AI内容创作者部署工作任务的GPU。
当然,除了AI加速的创意应用,也有很多应用并未进入AI加速的世界,著名的开源3D设计工具Blender就是其中之一。使用它官方提供的测试套件,我们针对NVIDIA GeForce RTX 4080 SUPER FE在3D渲染情况下的性能进行了测试。
可以看到,在三个项目中,NVIDIA GeForce RTX 4080 SUPER FE的性能优势都十分突出,尤其是Monster项目的性能相当显著,近乎翻倍。可以说,对于大部分3D渲染应用来说,这张NVIDIA GeForce RTX 4080 SUPER FE都能够拥有相当不错的表现。
而在面向传统工作站应用的SPECviewperf 2020测试中,我们也同样能够看到NVIDIA GeForce RTX 4080 SUPER FE强大的性能表现。除了核心性能之外,NVIDIA GeForce RTX 4080 SUPER FE也同样拥有更大的16GB显存,尤其对于显存敏感的图形工作站应用来说提升更为显著。
作为NVIDIA GeForce RTX 40 SUPER家族的收官之作,NVIDIA GeForce RTX 4080 SUPER Founders Edition在小幅提升性能的前提下大幅降价,搭配完整的AD103核心与16GB大容量显存,无论是4K 100帧以上的高分高刷高画质光追游戏体验还是在生成式AI中实现创意倍增都是一把好手,对比上一代NVIDIA GeForce RTX 3080 Ti提升幅度也相当显著。考虑到NVIDIA RTX生态应用突破500款,且随着时间推移越来越多的游戏将会引入DLSS 3,甚至原生以DLSS 3.5光线重建技术为基础进行开发,目前正在使用NVIDIA GeForce RTX 3080 TIGPU的用户也应该趁着这次机会升级到新卡。无论如何,以8099的售价而言,这张NVIDIA GeForce RTX 4080 SUPER Founders Edition作为旗舰级GPU的综合表现相当出色,作为RTX 40 SUPER三剑客的终章相当合适。