首页 文章详情

RTX3090 双卡对比测评

机器学习实验室 | 1136 2020-10-06 18:57 0 0 0
UniSMS (合一短信)
作者丨Theellyence
来源丨https://zhuanlan.zhihu.com/p/256371885
编辑丨极市平台
转自 | 极市平台

前言

本次要评测的两张RTX3090是 GAMING OC 24GSTRIX GAMING O24G,分别定位技嘉风冷中高端与华硕风冷旗舰。显卡来源:路边捡的。

既然是路边捡到而不是NV官方或者AIC厂商送测,就没有利益相关,想骂想夸都随意,不用被限制。

本次只是简单放点用采集卡抓出来的基准测试,以及少部分游戏游玩实况,玩游戏的时候不管帧数高低,我都秉承一个原则:4K分辨率、特效拉满、光追拉满,我认为这样才能把这种显卡的游戏潜力发掘完全。

更新:增加了大量视频后期三维特效软件的标准化比对测试。

外观

因为是路边捡来所以没有包装盒,也没有专业影视设备,就算有也不太会用,就尽量拍得稳点。

GAMING OC(上)与STRIX GAMING O24G(下)

GAMING OC 24G 侧视

STRIX GAMING O24G 侧视

我或者知乎很多玩家一向对STRIX的印象并不是很好,具体原因就不多说了懂得都懂,但STRIX OC这个型号的性能,确实从RTX20系开始就已经配得上ROG这三个字母。外观方面,ROG罕有地审美在线了,实现了板卡"ONE ROG"的审美,STRIX OC的背板与ROG的纯血Z490,也就是MAXIMUS XII系列的APEX和EXTREME的外观都非常契合,这很棒。

GAMING OC在本代虽然贵为“魔鹰”,但似乎霸气的只是名字以及不错的散热,外观是现代金属切割风格,没感觉出“魔”在哪里。真论外观以及起名艺术,还得看A卡非公们。

拆解与分析

STRIX GAMING O24G PCB 正面

简单分析:

  • 共22路供电;
  • 11+4+3三组共18路给了核心,控制器是两颗MPS的PM2888A,别看着芯源就急眼,这颗玩意是NV认可的,Power Stage是不错的,用了Ti的CSD95481RWJ,大致60A能力。
  • 1+1+1+1四组给了显存,控制器是UPI的uP9512Q,刚好4路分4组,背面同理,整合MOS型号同上。
  • 其实我不是很想吹ASUS,但这片PCB上确实有不少方便超频的设计,越肩非公一般代表着性能,毕竟能容纳更大规模的供电模组与更宽的散热模组,这规律在近两年简直是屡试不爽。此外一些标明了的电压量测点也很方便用来超频。

STRIX GAMING O24G PCB 反面

听说某视频站还有个知名媒体忘记检查显卡背面,看见正面有12颗美光的GDDR6X,就说RTX3090上的D8BGW是2GiB/颗的,这......(当然后来他们发现改正了,这是好事)

STRIX GAMING O24G 显存

与RTX3080一样,这两张RTX3090也使用了GDDR6X的美光显存,但不同于RTX3080的D8GBW,RTX3090使用的颗粒标识为D8BGX。

美光目前有两种GDDR6X颗粒,但需要去翻阅产品目录并下载Datasheet,美光官网的FBGA Decoder没有收录它们的信息,这里给出Datasheet附带的型号解读方法,自行参考即可:

MT61K256M32JE-19 与 MT61K256M32JE-21,分别对应RTX3080与RTX3090的 D8BGW / D8BGX,前者传输速率为19Gb/s,后者则是21Gb/s。

注意传输速率并不等同于带宽,这是两个概念,有兴趣了解或复习的朋友可以自行搜索Data Rate与Bandwidth的区别,这里不做赘述。

STRIX GAMING O24G 背板 反面

STRIX GAMING O24G 结构架

STRIX GAMING O24G 散热模组

散热模组由7根6mm全镀镍热管、镜面抛光底座,以及3把9.5mm风扇构成。

STRIX GAMING O24G 散热器 压力扣具

GAMING OC 24G PCB 正面

简单分析:

  • 共18路供电;
  • 9+4+2三组共15路给了核心,控制器分出来三颗,两颗是UPI的uP9521R,一颗uP9511R。Power Stage是来自万国的ON19,能力暂时不详。
  • 1+1+1三组给了显存,控制器是UPI的uS5650Q,刚好3路分3组,背面同理,整合MOS型号同上。
  • 这是一片普普通通的AIC公版方案PCB。

GAMING OC 24G PCB 反面

GAMING OC 24G 背板 反面

GAMING OC 24G 散热模组

散热模组由7根6mm热管、铜质底座,以及2把8.5mm、1把8mm风扇构成。

思路简述

这次仍然偷懒,主要用3DMARK的一些项目来测试性能_(不够严谨,别学)_,这回两张RTX3090的对手,是上篇文章的那张微星RTX3080 Gaming X Trio,俗称魔龙。

三张显卡在测试时的预设都是ALL AUTO,什么都不动。

测试平台:

主板:微星 MEG X570 Unify
CPU:AMD Ryzen 9 3900X
内存:芝奇 皇家戟 F4-4000C18D-16GTRS
散热:EK AIO 360 D-RGB
电源:海韵 PRIME FANLESS TX-700
固态:铠侠 TC10 240G / WD Black SN750-EK 1T
机箱:STERACOM BC1

各项配置的选择原因前文讲过了:

https://zhuanlan.zhihu.com/p/228238504

总之,多走动、勤锻炼有益身心健康,各位如果在家的话,看到这里不如放下手机,趴在地上单手做平板支撑,另一只手继续翻阅本文,说不定转头一看,就会发现柜子底下藏着你的女朋友/男朋友或者你的猫送给你的RTX3090。

测试环节

  • RTX3090与次旗舰RTX3080之间的对比;
  • RTX3090在PCIe 3.0与4.0两种环境下是否有区别;
  • 两个支持光追和DLSS的游戏实测;
  • RTX3090与次旗舰RTX3080在一些视频后期生产力软件中的差距。

《Death Stranding(死亡搁浅)》

《Call of Duty: Modern Warfare(使命召唤16)》

RTX3080 vs RTX3090 游戏基准测试

第一项,Time Spy Extreme(用于代表新世代大作)
第二项,Fire Strike Ultra(用于代表依旧比较吃配置的老游戏)
第三项,Port Royal(用于初步检验光追性能)

在上一篇文章中我提到了关于MSI Afterburner这个软件的事情,抱怨其中的OC Scanner功能失效,似乎并不适用于功耗尚未解放的新架构游戏卡:

连1%差距都拉不开真就离谱,离谱到我用Afterburner做个OC Scan都能跑出Error Code 3来。

时至如今,这个问题在新版Afterburner中似乎得到了底层技术上的解决,据朋友提示,在新版本中,OC Scanner似乎不再独立行动去试探功耗、电压、温度之间的平衡点,转而寻求底层驱动去主导判定,这十分有趣。

在新版Afterburner的加持与前段时间的摸索经验积累下,我使用前文的那张MSI RTX3080 GAMING X TRIO,通过超频(风冷)提升了约8%的性能(Time Spy Extreme Graphics Score: 9000/9698≈7.75%),在这里想问一句:由此,RTX30是否算作灰烬?或者只是“超频潜力不高”而已?

基准测试仍然会使用ALL AUTO的硬软件设置,以保证公平。

参与测试的型号是MSI RTX3080 Gaming X Trio与ROG RTX3090 STRIX OC。

Time Spy Extreme

Fire Strike Ultra

Port Royal

数据总结:

RTX3080
TSE: 9139 FSU: 11133 PR: 11639
RTX3090
TSE: 10806 FSU: 13095 PR: 13759

  • 在DX12环境下的Time Spy Extreme项目中,RTX3090领先RTX3080约18%;
  • 在DX11环境下的Fire Strike Ultra项目中,RTX3090领先RTX3080约18%;
  • 在光线追踪能力专项测试中,RTX3090领先RTX3080约18%。

巧妙的领先优势,不是吗?

当然,默认归默认,跑分归跑分,这张猛禽最高跑到了TSE图形分11532的成绩,让我短暂地登上了 3DMARK Time Spy Extreme 图形分 世界第一的宝座。当然,享受了十几个小时的虚荣就被某位大神送到第二去了,就像跑到TSE 9698图形分的那次RTX3080魔龙一般,接下来当然会被更多专业选手越送越远,就当体验一把了,哈哈。

此外,RTX3090支持SLI模式的NV-LINK双卡互联,但手中暂时没有对应槽位的NVL桥_(一张2.7槽一张2.9槽实在是太厚了)_,而且STRIX OC的PCB比GAMING OC更宽,物理上太难实现NVL。

PCIe 3.0 vs PCIe 4.0

在上篇文章里,测试结果表明RTX3080并不需要PCIe 4.0×16的加持,PCIe 3.0×16就足以使其完整发挥性能,RTX3090应亦如是?

以下是测试项目:

第一项,AIDA64 GPGPU Benchmark (PCIe 3.0×16) vs (PCIe 4.0×16)
第二项,Time Spy Extreme (PCIe 3.0×16) vs (PCIe 4.0×16)
第三项,Fire Strike Ultra (PCIe 3.0×16) vs (PCIe 4.0×16)
第四项,Port Royal (PCIe 3.0×16) vs (PCIe 4.0×16)
第五项,PCI Express feature test (PCIe 3.0×16) vs (PCIe 4.0×16)

其中,PCI Express feature test 这个项目是我上篇文章忘记做的,这次补上。在我看来虽然这种直接读写显存的测试并作为游戏场景的代表,但仍不失为一种“看数据”的好手段。

AIDA64 GPGPU Benchmark (PCIe 3.0×16) vs (PCIe 4.0×16)

因为测试存在误差,所以GPGPU Bench测了两遍,左侧是3.0,右侧是4.0。

Time Spy Extreme (PCIe 3.0×16) vs (PCIe 4.0×16)

DX12下的TSE,RTX3090用PCIe 3.0或4.0并没有区别。

Fire Strike Ultra (PCIe 3.0×16) vs (PCIe 4.0×16)

Fire Strike Ultra同样没什么区别。

Port Royal (PCIe 3.0×16) vs (PCIe 4.0×16)

Port Royal还是没什么区别......这种程度的差距只能被算作合理误差。

PCI Express feature tese (PCIe 3.0×16) vs (PCIe 4.0×16)

终于,在3DMARK专门的PCI Express带宽测试,终于体现出了区别,但这只是测试带宽,并不能直接与游戏性能联系,况且上边专门代表各种游戏情景的测试已经证明了很多。

游戏实测

4K DLSS 全特效 死亡搁浅
https://video.zhihu.com/video/1291800871983513600?

4K 全特效 光线追踪 使命召唤 现代战争
https://video.zhihu.com/video/1291802490871554048?

生产力软件测试

显然24G GDDR6X这种规模的显存,以及RTX3090本身的定价,看起来就不只是一张单纯的游戏卡,有几个跑工程软件的小伙伴见此直呼过瘾,并寻找或制作了一些demo,邀请我用TRX40平台对RTX3090进行测试。

由于我自己不够了解这方面,操作全程在朋友的远程技术支持下完成,所以耽搁了很长时间,也占用了他们很多时间,在此对读者们讲句抱歉,也对朋友们的鼎力相助表示感谢!

首先是在Houdini的5个物理模拟demo:

Houdini×RTX3090 物理测试:粒子模拟:

Houdini×RTX3090 物理测试:流体模拟:

Houdini×RTX3090 物理测试:粘性流体模拟:

(由于一篇文章只支持添加3个视频,因此部分视频需通过链接观看)

Houdini×RTX3090 物理测试:布料模拟:

https://video.zhihu.com/video/1293997798896353280?

Houdini×RTX3090 物理测试:烟雾模拟:

https://video.zhihu.com/video/1293998006523121664?

篇幅所限,就不把其他显卡的测试录屏也放上来了,在Houdini分别使用了

RTX2080Super/RTX2080Ti/RTX3080/RTX3090

这四张显卡测试渲染这几个demo,多次测试后取平均时间(越短越好):

接着是常用渲染器的理论性能测试,设计的测试项目如下:

Arnold Benchmark
OCtane Benchmark
Vray Benchmark
Blender Cycles (CUDA/OptiX)
D5 Render
Redshift Benchmark

这里不再一一放视频,直接做数据汇集:

demo渲染用时(越短越好):

内建Benchmark得分(越高越好):

最后测试了一下达芬奇内建的创作性能测试(越高越好):

DaVinci Resolve
RTX2080Super: 625
RTX2080Ti: 988
RTX3080: 1279
RTX3090: 1731

测试总结

RTX3090相比RTX3080强得“有限”,这可能会在许多人预料之中,毕竟同代同工艺同尺寸的GPU总不可能差距大到离谱——不太科学。

在反复测试不同类别的多款网游与单机大作后,从游戏帧率角度计算,RTX3090

  • 比RTX3080强17%;
  • 比RTX2080Ti强47%;
  • 比RTX2080Super强66%。

在测试过多款生产力软件后,从工作效率角度计算,RTX3090

  • 比RTX3080强21%;
  • 比RTX2080Ti强58%;
  • 比RTX2080Super强118%。

这就是我最终得出的结论。

(数据更新完毕)

末尾闲话

  • 像STRIX OC这种初期就能软拉23%功耗墙的高端旗舰放在Z490平台里,配合OC 5.3GHz的10900K进行双烤,最终电源端测到全平台功耗840-850W,高端非公RTX3090用户上个1000W高端电源真的不浪费。入手了高端非公还跟着NVIDIA的750W指引去买电源的,甚至还想超频使用的,偶尔给你来两下断电重启可别觉得冤枉。
  • RTX3090的功耗远不止于此,低端非公的350W与中端的400W显然不是上限,还能继续解开,最终旗舰非公们的功耗墙我预测都会从500W起步。
  • 关于生产力软件提升百分比,这里在更新前提前说一下。我有测PR AE的导出速度,但这里并没有放出,也没有纳入最终的计算,因为它们的结果实在是太相近了,反过来说就是显卡对于PR AE导出速度的影响并不大——它跟本不怎么工作!如果实在想比对,这里就直接放出数据:PR导出:【2080S 00:00:54】【2080Ti 00:00:50】【3080 00:00:39】【3090 00:00:25】,AE导出:【2080S 00:05:03】【2080Ti 00:05:11】【3080 00:05:03】【3090 00:05:01】。看了结果各位也想必明白了,意义真不大。
  • 关于RTX30系的电容选料问题、AIC的PCB设计问题、GPU Bin Down问题,本文不会更新对它们的看法。也许将来在这段事情告一段落后,我会单独开一篇谈谈自己对于本次诸事的浅薄看法,目前我认为还需要观察一段时间,没法很快定论。


往期精彩:

【原创首发】机器学习公式推导与代码实现30讲.pdf

【原创首发】深度学习语义分割理论与实战指南.pdf


喜欢您就点个在看!

good-icon 0
favorite-icon 0
收藏
回复数量: 0
    暂无评论~~
    Ctrl+Enter