AI+游戏完美平衡玩家需求,NVIDIAGeForceRTX4070SUPER首发评测
写在开头
早在RTX 20系显卡的时候,NVIDIA就推出过SUPER系列显卡,更好的性能与更高的性价比让无数玩家高呼“真香”!现在熟悉的“SUPER”系列显卡又来了,NVIDIA在CES上又给了全世界亿点点震撼,RTX 40系家族迎来了三位新成员,分别是GeForce RTX 4080 SUPER、GeForce RTX 4070 Ti SUPER与GeForce RTX 4070 SUPER。
今天我们率先上手的也是其中升级最大的GeForce RTX 4070 SUPER,官方称,这款显卡只用了RTX 3090的一小部分功耗,就实现了超越RTX 3090的性能,如果算上DLSS 3,性能领先优势将达到1.5倍!那究竟是否真的有如此强悍的表现,我们一测便知。
规格对比
首先照例先讲NVIDIA GeForce RTX 4070 SUPER的规格,其还是沿用了AD104核心,一个完整的AD104核心应该包括5个GPC图形处理集群、30个TPC纹理处理集群、60个SM流式多处理器以及一个带有6个32Bit显存控制器的192Bit显存带宽。也就是GeForce RTX 4070 Ti上的那一颗。
GeForce RTX 4070 SUPER代号为AD104-350,其规格相比RTX 4070有了“质的飞跃”,首先变化最明显的就是CUDA,核心数量也从5888个增加至7168个,增幅高达21.7%,这也是三款SUPER显卡里涨幅最大的。
L2缓存则从现有RTX 4070的36MB增加至48MB,赶上了RTX 4070 Ti的水准。基础频率为1980MHz,相比之前的型号也提高了60MHz,Boost频率则维持在2475MHz不变。显存容量也保持在12GB,显存频率为21Gbps,显存带宽为504GB/s,因为核心数量的增多,所以整卡功耗也略微增加20W至220W。
最直观的还是它的售价,NVIDIA GeForce RTX 4070 SUPER为4899元,而此前RTX 4070的价格是4799元,相较之前贵了100元。但从CUDA数量的增幅上看就知道,以100元换取20%以上的核心增幅还是相当划算的。至于GeForce RTX 4070 SUPER究竟有怎么样的表现,我们接着看。
外观赏析
给大家来一个开箱环节。不愧是公版显卡,包装的箱子也比其他AIC显卡大上不少。
我们手上的这款就是GeForce RTX 4070 SUPER FE公版显卡,包装盒与此前的RTX 4070还是有一丝丝差距的,左下角的型号标识改为了黑灰色设计,后缀印有醒目的”SUPER”字样。
内部还是经典的图案,GeForce RTX 4070 SUPER FE公版显卡放在那有种“速度穿越”的感觉。
放大看细节,这次新增的“SUPER”后缀是凸刻的,这一点与原有的RTX 4070凹刻形成了鲜明对比,并且这个SUPER后缀还是亮面设计,不同角度看过去会有微微发光的形态,颇为引人注目。
包装盒内还有一条+12VHPWR 16Pin转双8Pin供电线,如果你没有换装最新的电源,用它进行转接也能轻松使用。
GeForce RTX 4070 SUPER FE公版显卡的整个外观设计延续了RTX 40系列FE公版的整体风格。不过由于改用了黑色的名牌标识与装饰条,所以整张卡由于一位黑武士一般,凌厉威武。
并且整张显卡用了包括抛光、磨砂等多种工艺。不同表面处理工艺带来的不同反射率让这张GeForce RTX 4070 SUPER FE公版显卡更显精致。尾部则是一整排的大面积散热鳍片,配合整张显卡全金属的设计也确实更有利于散热。
显卡风扇采用的独特排布方式,这也是目前GeForce RTX FE公版显卡中较为常用的散热设计方案。
一正一反散热风扇的设计可以加强机箱内散热风道的形成,而根据NVIDIA给出来的数据显示,这一套散热系统比上一代显卡提供了最大气流多20%,而在同噪音的条件下,气流多15%。
辅助供电方面,不同于RTX 4070一些非公设计有8Pin接口,这次的GeForce RTX 4070 SUPER显卡均采用+12VHPWR 16Pin供电的设计,FE公版还赠送了一条12VHPWR 16Pin转双8Pin供电线,这样可以方便大家使用。同时NVIDIA官方建议搭配GeForce RTX 4070 SUPER显卡的为650W额定功耗的电源。
输出接口方面,仍然昰老配方:3个DP1.4+1个HDMI2.1的设计,可以实现3+1屏联屏输出。笔者这里建议大家优先使用顶部的第一个DP接口或者是HDMI接口来连接显示设备。
另外,从这个角度还能看到这张显卡的厚度,其体积跟之前的RTX 4070 FE一致,相当小巧,根据笔者手工测量245*40*100mm的规格来看,这卡直接安装到A4等小巧的ITX机器里完全是没有问题。
显卡拆解
GeForce RTX 4070 SUPER FE公版显卡的拆解是从背部开始,背板其实有是两层,一层是金属装饰板,另外一个是固定PCB的金属背板。
固定显卡的则是我们眼前的这个中框,它是一个体成型的铝合金框架,内部有三个小卡扣,能够把显卡的散热器主体牢牢固定。
并且拆会发现公版显卡的做工、细节是如此的细致,环环相扣,这也是其他显卡无法比拟的。
拆解完成后你会发现,其实GeForce RTX 4070 SUPER FE公版显卡的PCB很是小巧,集成度还是一如既往的高,整体主打精致感。
既然拆到这了,那就先看看它的散热器,正反两面都配有2把散热风扇,四周则是密密麻麻的散热鳍片。
整个散热器摸起来沉甸甸的,分量还是相当足,有一说一,GeForce RTX 4070 SUPER FE公版显卡用这个规格的散热已经够用了。当然如果你是追求极致散热的用户,那AIC的非公产品会更适合你。
翻转看看散热器的另一侧,GPU位置是纯铜底座,底部分经常铣削处理,比较平滑;散热器四周都经过了黑化的处理,这样散热器的抗氧化性能更高;同时显卡和供电部分都配上了导热垫辅助散热。
再看看这款显卡的PCB,密集的电子元器件布满整张PCB,离近了看宛如一座小型城市一般,FE公版显卡还是那样的精致,这也是无数玩家青睐FE版显卡的原因之一。
不同于其他AIC非公产品,公版显卡的PCB背面也是充满艺术感,并且PCB的背面还隐藏了很多控制芯片,下面我们也会给大家一一讲解。
我们的主角就静静的躺在PCB的正中央,GeForce RTX 4070 SUPER显卡核心编号为AD104-350-A1,这颗核心采用TSMC 4N NVIDIA定制工艺打造,295mm2的芯片面积内塞下了7168个CUDA 核心,同时内部还有56个第三代RTX Cores,224个第四代Tensor Cores以及48MB的L2缓存,性能强劲不言而喻。
核心四周为6颗显存,它们是由美光提供的GDDR6X显存,芯片丝印型号D8BZC,单颗显存容量为2GB,6颗显存共组成12GB。并且它们可以实现21Gbps的等效频率,让这款显卡能够应对更多复杂的场景。
供电规模部分,我们手上的GeForce RTX 4070 SUPER显卡只配备了6+2+1相。以AD104的规模,目前这个规格即可满足,没必要过分的堆料。
无论是核心供电还是显存供电都采用了独立的DrMos芯片,为NCP出品的DrMos芯片,内建了上下两桥与驱动IC,持续最大输出电流可达到50A。
PWM供电芯片则被安排在PCB背面,型号为uP9512R和uP9529Q,用于同时管理核心供电金和显存供电。
背面还有一颗名为uS5650Q的芯片,其担任电压/电流/功耗监控的工作,是不可或缺的芯片之一。
电源接口,我们熟悉的老朋友——12VHPWR接口,GeForce RTX 4070 SUPER的TDP只有220W,用8Pin其实也是足够的,但对于主推PCIe5.0供电规范的NVIDIA来说,未来将会是12VHPWR的天下。
测试平台介绍
开始性能测试前介绍一下本次的测试平台,CPU使用的是旗舰级的Inteli9-14900K处理器。
主板同样为旗舰级的MSI MEG Z790 ACE MAX主板。出色外观的下是更加豪华的用料配置,单相105A核心24相的供电系统保证了14代处理器的极限性能发挥,同时这款主板对高频内存的支持也是相当优秀,实测XMP开启后7200MT/s的频率十分稳定,并且它还具备了轻松超频至8200MT/s的强大实力。如果你是一个对性能有所要求的用户,那MSI MEG Z790 ACE MAX主板绝对是一个不错的选择。
正如上面所说,我们的内存就是G.Skill 幻锋戟Z5 RGB DDR5,在这款主板上轻松达成DDR5-7200 C36的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。
其他配置就不一一介绍了,装机平台如下所示,都是时下最顶级的配置。
看完了我们的装备,研究一下这张全新的NVIDIA GeForce RTX 4070 SUPER显卡。通过GPU-Z看看显卡的规格参数,这张显卡的基础频率比之前的RTX 4070要高不少,达到了 1980MHz。TDP也是提高了20W,达到了220W,不过NVIDIA这张GeForce RTX 4070 SUPER FE版似乎有特殊加持,TDP可以上探到240W,温度墙也给到了88℃,应该有不小的超频空间。
理论性能测试
说了那么多,该开始测试性能了。3DMark是每次理论性能的必测项目,NVIDIA GeForce RTX 4070 SUPER的表现可谓惊人,实测它的性能至少比RTX 3070强50%以上,提升最明显的是它的光追性能,涨幅高达55%。不过玩家肯定关心它跟40系的对比会怎么样,实测理论性能对比RTX 4070的话,领先幅度也有20%以上,刚好与其CUDA数量的增幅一致。对比RTX 4070 Ti则差距在10%左右。
DLSS也是NVIDIA引以为傲的黑科技之一,新显卡的DLSS性能自然也有不小的提升。同样分辨率下,开启DLSS 2,NVIDIA GeForce RTX 4070 SUPER的帧数要比RTX 4070高20帧,从理论上已经达到了2K高刷游戏的门槛。并且4K分辨率下,开启DLSS 2后已经有74 FPS,证明这款显卡其实是可以实现4K游戏的。
科学计算方面,NVIDIA GeForce RTX 4070 SUPER同样展现了新显卡的超强实力,其单精度和双精度浮点运算基本是前代的60%以上,整体性能领先更是来到了50%以上。不过由于众所周知的原因,Hash算力就没有前代那么高了。
游戏性能测试
游戏测试更显NVIDIA GeForce RTX 4070 SUPER的魅力,在1080P分辨率下,大部分游戏都逼近200 FPS了,看来这个分辨率对这张显卡还是太轻松了。性能提升幅度方面,这款显卡相比30系同级显卡性能提升在40-50%左右,面对RTX 4070则性能领先在10%左右,如果对比RTX 4070 Ti,差距在10%以内,属于是越级体验了。
2K分辨率一向是70级显卡的主战场,在DLSS 2下,NVIDIA GeForce RTX 4070 SUPER的表现已经相当出色了。大部分游戏光靠DLSS 2就能实现高刷体验,对比同是40系的两位,NVIDIA GeForce RTX 4070 SUPER很好的卡在了中间的位置,领先RTX 4070约10%左右,与RTX 4070 Ti的差距也不算太远。
总的来说,NVIDIA GeForce RTX 4070 SUPER绝对是2K高性能游戏的首选,甚至于以它不止2K,以它的表现,4K游戏也是可以一试的。实测其整体性能领先上代70级足足有50%以上,基本已经达到了上一代RTX 3090显卡的水准。即使是面对自家的RTX 4070 Ti也丝毫不虚,性能差距较小,但售价更低,无疑性价比相当突出,可以说是最值得购买的2K游戏显卡。
DLSS 3DLSS 3.5性能测试
上面的游戏性能测试更多是基于DLSS 2进行的,那RTX 40系引以为傲的DLSS 3又是什么呢?其实DLSS 3就是在DLSS 2的基础上新增了帧生成和NVIDIA Reflex技术,据说游戏用上这项技术,帧数最高可以做到翻倍的提升!
并且现在DLSS已经不止于3.0,老黄在前不久甚至带来了3.5版本,在光追层面大做文章,带给玩家更真实的体验。DLSS 3.5,它一共由四个部分组成,分别是超分辨率,帧生成,Reflex低延迟,还有新增的光线重建技术。其中前三部分是DLSS 3就拥有的,而全新的光线重建技术更像是一套专为“光线”定制的DLSS,它的目的就是解决人工降噪器带来的细节缺失问题、鬼影问题等。讲人话就是,用上DLSS 3.5后,你能获得更真实的光影效果,几乎接近真实世界的画质,将带给你更沉浸的体验。
下面我们给大家实测,看看性能表现。
3DMark DLSS 3理论性能测试
不过在这之前,我们还是先看看DLSS 3的理论性能究竟如何,实测下来,有DLSS 3的加持下,NVIDIA GeForce RTX 4070 SUPER在2K分辨率下,开关DLSS 3的差距接近3倍以上,150 FPS的表现也告诉你它确实能够胜任2K高刷游戏这份殊荣,比起之前的RTX 4070也要高出15 FPS以上!4K分辨率也不虚,97 FPS的表现足够大多数3A大作流畅运行。
游戏实测
光看理论没啥意思,来点游戏实测。这里直接上压力最大的赛博朋克2077,无论是1080P还是2K分辨率,搭载了DLSS 3的NVIDIA GeForce RTX 4070 SUPER显卡都遥遥领先于前代显卡,并且性能差距足足超过100帧以上,有了DLSS 3,几乎是翻倍的性能提升。
更值得关注的还是功耗表现,你看同样是玩赛博朋克2077,NVIDIA GeForce RTX 4070 SUPER的功耗还要更低一些,更低的功耗更强的性能,选谁不用我说了吧。
另外赛博朋克2077这款游戏也支持了最新的DLSS 3.5,我们也用NVIDIA GeForce RTX 4070 SUPER进行了实测。给大家感受一下DLSS 3.5的光线重建技术,打开光线重建后,地面上的倒影比关闭时拥有了更多的细节,建筑和广告牌上的轮廓十分锐利,文字也清晰可辨。在带有反射的场景里面,光线重建都能带来非常惊艳的效果。
在有光影的地方会更加明显,像下图一样,开启光线重建后,护栏的倒影能够很好的印在背后的红墙上,更符合实际观感。如果是以前的光追,则无法做到这个效果。并且后方楼宇的墙在光线重建技术下,会更贴合实际,光线照射不到的地方则会变暗,另外两者则是一直保持照亮的状态,不太符合现实。
并且开启DLSS 3.5以后的画质也相当能打。这里我们也是录制了原生4K以及DLSS 3.5的四档画面在ICAT中进行画质对比,实测下来,即使开启帧生成以及光线重建后,画面用低分辨率超分渲染至4K,但在观感上与原生4K几乎没有任何差距,甚至文字细节上还要优于原生档。
画质看完再看看性能,三种分辨率我们都试了。首先不用说DLSS 3跟DLSS 3.5,它们的表现相比DLSS 2肯定是质的提升,这一点毋庸置疑。不过由于DLSS 3.5引入了光线重建技术,因此开启DLSS 3.5后,游戏帧数虽然小幅下降,但换来的画质表现还是相当惊艳的。
经过体验下来,我们认为新的DLSS 3.5对于玩家来说意义还是非常大的,其新增的光线重建技术让光追游戏画质的大幅提升,配合DLSS 3的帧生成技术,实现了画质和游戏帧率的双“丰收”。希望未来会有越来越多的光追游戏支持DLSS 3.5,并且不再限定于某几种画质预设,这有助于扩展DLSS 3.5的使用范围,为玩家带来更好的游戏体验。
另一方面,RTX 20/30系显卡虽然也能够开启单独光线重建技术,但它的作用更多是“锦上添花”,不会像DLSS 3.5那样带来巨幅的帧率飞跃。要想完全发挥DLSS 3.5的实力,还是需要一款RTX 40系显卡。
其他DLSS3游戏测试
其他游戏的DLSS 2与DLSS 3对比我们也测了,基本上NVIDIA GeForce RTX 4070 SUPER在开启DLSS 3后,游戏帧数都有不同程度的提升,一些优化好的游戏,甚至能够实现翻倍的性能体验,另外DLSS 3还有一个作用就是开启以后,游戏的1%Low帧会有一定程度的增强,反应在游戏中就是你的游戏体验更丝滑,卡顿掉帧的情况更少。
如果你将NVIDIA GeForce RTX 4070 SUPER与RTX 3070相比,那你会发现它的性能提升更是恐怖,随便领先个五六十帧不成问题。实测开了DLSS 3后,NVIDIA GeForce RTX 4070 SUPER在大多数游戏中都要比RTX 3070强70-80%以上,绝对是你畅享2K游戏的最佳之选。
4K分辨率我们也测试了,虽然NVIDIA将GeForce RTX 4070 SUPER定位为一张2K高性能的游戏显卡,但以它的配置,冲击4K也不是不可能。实际测试下来也确实如此,只要把DLSS3一开,游戏流畅度就直接上来了,不少游戏已经不止能跑个60+FPS,接近百帧的游戏表现,降点画质甚至可以实现4K高刷游戏。
RTX 视频超分辨率性能测试
有些时候你是不是也会有这样的烦恼,那些480P甚至360P的早期视频清晰度不够,看起来不够清楚?现在这种烦恼将不再困扰你。除了游戏、生产力软件能用DLSS,视频现在也能!NVIDIA的RTX Video Super Resolution 视频超分辨率技术RTX VSR就是视频的DLSS,其通过AI技术即可提高浏览器内的视频的分辨率,展现前所未有的显示效果。
只要你是RTX 30系或RTX 40系的显卡,在NVIDIA控制面板中找到视频图像设置,就可以手动开启RTX Video enhancement即RTX 视频超分辨率技术RTX VSR,其中分为1-4档调节,数字越大质量越好。
实测环节,可以看到在开启RTX 视频超分辨率技术之后,原视频里的人物线条由原本的模糊不清变得十分清晰锐利,并且随着视频超分辨率级别的提高,清晰度逐级提升,甚至部分细节已经接近原生1080P了。
在暗部表现同样如此,原视频里地板如同劣质贴图,有视频超分辨率加持后每块砖头都清晰可见,且立体感满满,尤其是旁边绿色植被的清晰度更高了一个数量级。除此之外,视频超分辨率技术的AI算法似乎还能够通过类似DLSS帧生成的方式计算出物体的远近关系优化景深效果,这一点同样能够使得画面整体观感得到提升。
这里我们也给大家准备了对比视频,从视频里就可以看到RTX 视频超分辨率的效果之明显,最高级别的VSR 4跟原生480P相比就是一眼的区别,在开启RTX 视频超分辨率技术后,部分图像质量有了显著提高,不仅锯齿和噪点几乎全部消失,颜色过渡也更为平滑,目前RTX 视频超分辨率能有这种表现堪称惊艳。
当然你除了在浏览器能够使用这项功能外,本地浏览器也能享受黑科技的魅力,我们将浏览器中的视频与本地的视频同时进行RTX 视频超分辨率 4档渲染,从画面上看,右侧本地播放器的效果要弱于左侧浏览器的,浏览器上的4档VSR线条更锐利,画质也更清晰,不过即使是本地播放器的效果也要远强于原生480P。
我们也将原生480P与浏览器和本地播放器上的视频超分辨率渲染视频进行对比,从视频画面中可以看到,本地播放器上4档视频超分辨率渲染过后,文字或线条都相比原生480P有一定提升,至少以前模糊不清的视频可以看了,不过对比浏览器的效果还略有差距,后者的效果已经接近原生1080P了。
有用户可能担心功耗的问题,我们这里有实测了一下,使用浏览器在线观看视频的情况下,开启VSR 4档,GeForce RTX 4070 SUPER的功耗仅有29W左右,如果你开启的是视频超分辨率1档,那功耗更是不足20W,所以日常观看一些老番或者清晰度比较差的视频时,笔者还是推荐你开启视频超分辨率,真的会让画质有一个“质的提升“。
创作者性能测试
基础的办公生产力我们用UL Procyon进行测试,不过丝滑办公对这款显卡的压力都太小了,差距基本不太明显,不过NVIDIA GeForce RTX 4070 SUPER依旧比RTX 3070强8%以上。
而在Adobe或达芬奇等软件的Benchmark中,NVIDIA GeForce RTX 4070 SUPER的表现也毫不逊色,特别是在达芬奇里,因为有了AVI编解码的支持,NVIDIA GeForce RTX 4070 SUPER的性能相比RTX 3070足足提升了50%以上,换装新显卡无疑能够大幅提升你的工作效率!
再看看渲染方面的表现,在N卡常用的Blender和V-Ray渲染软件中,NVIDIA GeForce RTX 4070 SUPER相比RTX 3070平均有70%的性能提升,如果对比RTX 4070,性能优势也有20%以上,并且与RTX 4070 Ti仅有不到10%的差距,“SUPER”这个后缀真的让这款显卡有了更强的表现。
来个压力更大的Arnold渲染器,它是一个先进的蒙特卡洛光线追踪渲染器,主要用于电影和高端视觉效果制作。不过之前它比较依赖CPU渲染,即便新版本添加了GPU支持,但与某些专门的GPU渲染器相比,性能仍有提升空间。不过我们有NVIDIA GeForce RTX 4070 SUPER显卡,它的性能想到出色,在实测中基本与RTX 4070 Ti平起平坐,对比起前代显卡的话,性能更是暴涨150%!
再介绍一个有意思的,D5 Render是基于DXR和光线追踪技术构建的GPU渲染器。眼尖的小伙伴已经发现了——“光线追踪”!没错,这款渲染器也支持我们上面提到的DLSS 3.5,有了这个技术,创作者将享受更流畅的编辑体验,进而实现直观的交互式3D创建。
我们实测也发现了,启用 DLSS 帧生成和光线重建后,视窗中的FPS提高了2倍以上,能够在大型场景中提供令人惊叹的分辨率和视觉质量。而没有DLSS 3的RTX 3070在帧数表现上就有些可怜了,因此如果你是这类渲染器的工作者,还是建议你直接升级成NVIDIA GeForce RTX 4070 SUPER,更强的性能开启实时渲染新纪元。
并且我们也进行了对比,开启DLSS 3.5以后,画质的提升真的异常惊艳,你一眼就能看出二者的差距。
工业领域的提升也是惊喜连连,在SPEC 2020中,NVIDIA GeForce RTX 4070 SUPER的性能提升肉眼可见,平均都有30%左右的性能提升幅度。
提升最大的则是OC渲染器,性能足足比RTX 3070高了60%以上,就像工业软件也有DLSS 3加持一样,超越极致的性能表现,给用户无以伦比的体验。对比RTX 4070的话,性能也有20%左右的领先,关键是售价基本不变,更高的性能释放,绝对是你的不二之选。
NVIDIA编码器测试
强悍的创作性能助力无与伦比的创意,不过创作需要超快的渲染速度,更要有特殊的硬件加持。NVIDIA GeForce RTX 4070 SUPER显卡一样支持时下热门的AV1编码,作为下一代主流的视频编码技术有着自己独特的优势,更快的编码速度和更高质量的流媒体传输性能,让越来越多的剪辑软件和视频网站青睐于它,像我们熟悉的达芬奇、剪映、B站等已经支持AV1编解码,未来AV1将会成为一个新趋势。
我们使用NVIDIA提供的8K片源与工程文件分别测试AV1格式和H.265格式下的编码时间。实测同一段素材下,同样使用H.265编码,有编码器的加持下,GeForce RTX 4070 SUPER的效率比RTX 3070快20%以上,即便是对决同门师兄弟,GeForce RTX 4070 SUPER的速度也相当优越,对比RTX 4070也要快5%左右。
值得一提的是AV1编码还有一个优点就是,它的文件占用空间比H.265要小,无论是4K分辨率还是8K分辨率,使用AV1编码后,文件整体大小能够降低25%以上。经过对比,AV1编码的视频在画质上与H.265也没有明显差距,可以说AV1对战H.265是全方位的领先,势必会成为下一个最受欢迎的格式。
AI运算能力测试
人工智能AI已在各行各业得到普及应用,为人类社会带来了巨大机遇,创造了难以估量的价值。曾经想要玩转AI,对普通人来说,是一道不小的门槛,现在情况发生改变了,那就是以Transformer为基础的大模型语言模型ChatGPT和以Stable Diffusion为基础的扩散模型层出不穷,改变了只有大公司和专业人士才能使用人工智能技术的门槛,普通人的使用门槛低到只需要有显卡甚至有一个手机就可以用AI来进行文字创作和图片创作。
还是老样子,先来个理论性能测试,我们这里也是用UL Procyon的AIGC测试对几张显卡的AI性能进行了评估。测试项目选的是UL Procyon的NVIDIA TensorRT version,测试了包含float32、float16以及integer三个部分。
实际结果来看,GeForce RTX 4070 SUPER的AI性能对比上代显卡肯定是遥遥领先,对比RTX 4070的话,性能也有10%的提升,基本已经跟RTX 4070 Ti在同一起跑线了。玩家作为入门使用的话,那这款显卡还是相当不错的,加上还有12G的大显存,这在AI领域已经有不小的优势了。
下面是基础的AI能力测试,使用达芬奇AI ACCELERATED MAGIC MASK测试时,可以看到它的完成时间为18秒,而前代的RTX 3070则是28秒,你可能觉得时间差距不大,但项目一旦复杂起来,NVIDIA GeForce RTX 4070 SUPER会让你的效率快55%以上。
在另一款AI应用软件ON1 Resize AI 2023中,使用AI将5张图片提升200%分辨率,此时GeForce RTX 4070 SUPER的速度为平均8秒一张,而上代的RTX 3070为14秒,对比RTX 4070,则新显卡会快30%以上,如果对比RTX 4070 Ti话,二者已经不分伯仲了。
接下来请出的是大家耳熟能详的Stable Diffusion,不过这回可与之前不一样了。NVIDIA还带来了Stable Diffusion WebUI TensorRT扩展的更新版,包括SDXL、SDXL Turbo、LCM-LoRA加速以及优化的LoRA支持。据说,这个TensorRT不仅能提高了工作效率,还让Stable Diffusion更快地生成高质量的图像。
先来点简单的,用SD1.5的模型生成10张512 x 512的图片进行测试,NVIDIA GeForce RTX 4070 SUPER用时40s,相当强势。
在开启TensorRT Engines加速后,同样的配置,生成用时仅需18s,效率直接翻倍,并且显存占用也没有明显增多,不得不说这个TensorRT扩展有点东西。
那现在更主流的SDXL模型能不能用呢?答案是能!并且速度也很快,实测在不开启TensorRT Engines的情况下,NVIDIA GeForce RTX 4070 SUPER完成10张1024x1024的图片需要接近4分钟。
开启TensorRT Engines以后,就一个感觉——“特别快”!一样是1024x1024的10张图,跑图速度直接比没开时快了2倍甚至3倍。
这里我们也给大家汇总了一下几张显卡的表现,NVIDIA GeForce RTX 4070 SUPER的表现已经跟RTX 4070 Ti差不多了,毕竟二者在硬件配置上大差不差了。不过对比RTX 4070,NVIDIA GeForce RTX 4070 SUPER还是有不小的优势,要是对比前代显卡那只能说是降维打击,毕竟前者有12GB的显存优势,而RTX 3070仅8GB的显存在没有特殊优化的情况下,很难实现生成1024x1024的大图,也无法使用SDXL的TensorRT Engines进行加速。
另外,NVIDIA GeForce RTX 4070 SUPER的AI能力远不止于此,在今年的CES上,NVIDIA还推出的ACE微服务,简单来说,它可以让游戏、工具和中间件开发者更便捷地将最先进的生成式AI语音、动画模型应用到游戏中的虚拟数字人物里。玩家可以与游戏内的NPC进行实时对话,并且每次对话的反馈结果都不是一成不变的,这种声临其境的游戏体验在未来又将给游戏行业带来颠覆性的改变。
本月NVIDIA还会有Chat with RTX的技术Demo诞生,其可以由TensorRT-LLM加速,让AI爱好者使用名为“检索增强生成retrieval-augmented generation,RAG”的热门技术,将PC端侧大模型与自己的数据进行连接。说人话就是大模型可以很好的学习本地的数据、文件、内容等等,从而成为一个更“了解”用户的AI,为你提供更佳的使用体验。
功耗与发热表现
相信大部分的玩家都比较关心GeForce RTX 4070 SUPER显卡发热与功耗的问题,毕竟此款显卡相比RTX 4070要高了20W,但是散热规格没变,下面就让我们见识一下NVIDIA GeForce RTX 4070 SUPER FE版散热器的实力。
Furmark烧机20分钟后,GeForce RTX 4070 SUPER显卡核心最终温度稳定在65.8度,热点温度为75.8度,显存温度为66度,风扇转速约为1700rpm,此时显卡的最大功率为216.7W,12VHPWR供电功率为202W。
相较几款横向对比的显卡,在Furmark烤机方面,此款GeForce RTX 4070 SUPER显卡的功耗还真是相较低的。同时可看到RTX 40系列显卡转变成12VHPWR辅助供电后,整块显卡的供电基本就是依赖此接口,PCIe供电辅助都较低。
Furmark只能说明显卡在重度负载的情况下功耗表现,那么我们再利用HWINFO与PCAT工具对显卡对行功耗的监控。从不同的应用软件来看,GeForce RTX 4070 SUPER显卡功耗表现基本都是控制在TDP 220W以内,相较更高级别的显卡的确是有着更好的功耗表现。
实测下来,不禁感慨RTX 40系显卡确实有点东西,相比RTX 4070来说,GeForce RTX 4070 SUPER显卡仅多出20W功耗,性能直接进步了不少,相比前代显卡来说,RTX 40系显卡的每瓦性能表现有着再进一步的提升,功耗大差不差的情况下,却带来了极致的性能增长,并且温度控制甚至是能耗比都可以说是N卡的新高度。
评测总结
实测下来,NVIDIA GeForce RTX 4070 SUPER完全延续了”SUPER”系列一直以来的神勇表现,更高的规格带来更优的性能释放,整体性能自然是超越了RTX 4070,与RTX 4070 Ti旗鼓相当,不过TDP仅仅只是增加了20W,感觉这张卡在功耗、发热量、性能、价格方面都取得了一个堪称完美的平衡。
游戏性能绝对是最重要的一环,DLSS 3乃至DLSS 3.5不仅利用帧生成技术实现更高的游戏流畅度,还让游戏画质有了进一步的提升,这在我们的实测中都得到很好的验证。目前支持DLSS 3的游戏也越来越多,而支持NVIDIA RTX的游戏也已经突破500款,未来随着这类技术的不断开发与完善,届时玩家也能享受到更出色的游戏体验。
当然,值得一提的还有这款显卡的AI性能,有了TensorRT之后,NVIDIA GeForce RTX 4070 SUPER在AI画图上面,可以更加充分发挥出硬件的优势,不仅出图速度明显变得更快,对比前代显卡更是遥遥领先。如果你是内容创作者或者有生产力的需求,想要强劲的AI性能,那这款全新推出的NVIDIA GeForce RTX 4070 SUPER就是你最好的选择。
最后真香的其实还是售价,NVIDIA GeForce RTX 4070 SUPER定价4899元,虽然比之前的RTX 4070涨了100,不过它的规格提升可不止售价提升的那点幅度。超过20%的硬件规格提升,带来的是更加强悍的性能释放,从我们的评测数据来看,无论是游戏性、视频创作性能,甚至是专业内容创作性能,都比RTX 4070更优秀。同时如果我们拿RTX 4070 SUPER与上代RTX 3070显卡对比,那更是爆杀,无论是游戏性能、内容创作还是Ai能力都是全面领先。总的来说,NVIDIA GeForce RTX 4070 SUPER称得上兼具性价比与性能的完美结合。