索泰RTX 5090 D 32GB SOLID OC显卡评测:DLSS 4塑游戏体

2025-02-07 18:35:07

  新年刚过,去年底刚刚公布的 RTX 50 系列显卡已经开始铺货,不过受限于产能目前想要首批买到新显卡还有点困难。近期会陆续给大家带来首批 RTX 50 系显卡的体验评测,本期聊一下高端定位的索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡,给大家先解解馋。

  索泰近几年在显卡外观设计上非常大胆,并在高端和旗舰显卡产品上采用双 BIOS 的激进性能调度。本次我们就借助一套旗舰配置,看看它能的表现如何。测试平台具体配置如下:

  一、外观设计

  索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡的装甲部分采用了硬朗线条设计风格,辅以大量栅条元素装饰,使整体呈现出一种工业风美学。

  看似无序的斜切线条装饰,实则蕴藏着对称和工整的内敛之道。黑金色搭配的环刃风扇,在光线下呈现的光泽更显质感。低饱和的灰色金属装甲,通过丰富的栅条呈现出独特的层次感和工业风。

  全新设计的环刃风扇部分增加了环形倒流风罩,优化了扇叶曲率和结构稳定性,降低风噪的同时能够进一步增加风量和风压,提升散热效率。

  显卡尺寸上,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡的三围分别是 329.7mm x 137.8mm x 67.8mm,净重约 2.3kg 左右。

  索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡背板同样采用了硬核工业风的设计,右侧提供了大面积的斜切细条开孔和不规则镂空开孔,两种很少出现在一起的开孔设计相互碰撞,反而让背板显得更有特色。

  透过镂空开孔,能够看到卡身内部厚实的散热格栅,还有看不到的巨型 VC 均热板和镀镍符合热管加持,通过贯穿是散热设计,让风吹透鳍片,达到全方位立体散热效果。

  显卡两侧同样被厚实的散热装甲包裹,并且在靠近显卡背板的一侧做了一圈金色的铝合金加固条。顶部侧面镂空字符的 ZOTAC GAMING 标志和旁边的索泰 Logo 支持 RGB 灯效,亮机后可实现炫酷的多彩 RGB 效果。

  居中位置设有一大一小两个开孔,分别内置了幻光同步接口、双 BIOS 开关以及 16pin 显卡供电接口。其中幻光同步接口配合随箱附送的专属线材连接至主板 ARGB 端口,轻松控制显卡灯光,而双 BIOS 开关可提供加速模式和寂静模式两种风扇策略预设,兼顾满血性能和静音表现。

  I/O 接口方面,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡提供了 3 个 DP2.1b 接口以及 1 个 HDMI 接口,挡板中间还印有一个白色的索泰 Logo。

  配件方面,包装内提供了一条 16pin 转 4*8pin 的供电转接线,幻光接口专属白色灯光线,可拆卸铝合金显卡之家以及一张彩色卡通形象卡片。

  二、架构解析

  NVIDIA GeForce RTX 5090 D 采用了全新的 Blackwell 架构,官网的介绍页面赫然写着一列“专为游戏玩家和创由于加入了神经网络渲染,Blackwell 的多单元流处理器 具有更高的处理吞吐量,并与 Tensor Core 更紧密结合,从而优化神经网络着色器的性能。

  为了满足下一代 DLSS 多帧生成的帧率稳定性需求,Blackwell 架构搭载了基于硬件的 Flip Metering,将帧率逻辑转移到显示引擎中,使得 GPU 能够更精确地管理显示时间。同时显示引擎还增强了两倍的像素处理能力,以支持更高的分辨率和刷新率,从而释放 DLSS 4 的性能潜力。

  在第五代 Tensor Core 中新增了对 FP4 浮点运算精度的支持,FP4 是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率。FP4 使用显存不到 FP16 的一半,GPU 性能的提升却高达 2 倍。在生成式 AI 应用中,GeForce RTX 5090 D 的 FP4 图像生成速度是 RTX 4090 D 上 FP16 的 3 倍,显存消耗减少一半。

  在 RT Core 方面,提升了检测光线、路径与三角形相交的效能,可以对大量几何图形细节进行光线追踪。在新一代 Blackwell 架构下光线、路径与三角形相交的检测效率为上一代的 2 倍,初代使用 RT Core 的 Turing 架构的 8 倍,并增强了压缩以减少内存占用,相比上代的显存使用率节省了 25%,光线追踪效果也得到了前所未有的细节提升。

  除了技术上的提升,Blackwell 架构的 GPU 还搭载了 GDDR7 显存。GDDR7 采用的是 PAM3 信号编码机制,与 GDDR6 和 GDDR6X 有所区别。PAM3 每两周期的数据传输为 3 位,相比 GDDR6 和 GDDR6X 更省电,带宽也进一步提升,速度高达 30Gbps。

  Blackwell 还通过 PCIe 5.0 和 DisplayPort 2.1b UHBR20 实现了增强,单一通道支持 20Gbps 带宽,从而支持高达 8K 165Hz 的显示器。Blackwell 架构 GPU 配备了第九代 NVENC,支持 H.264 / H.265 4:2:2 编码的 8 位和 10 位输出。

  具体到产品规格上,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 基于最新一代 GB202 核心和 TSMC 4N 架构制程工艺打造,内有 21760 个 CUDA 核心、680 个 Tensor 核心、170 个光追核心、680 个纹理单元、176 个 ROP 单元,核心规模相比 RTX 4090 大致相当,但解锁了完整的 GPC 单元,单元内的 SM 和 TPC 群组数量均有增加。

  索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡默认的 GPU 频率范围是 2017MHz-2317MHz。显存方面升级为 512-bit 32GB GDDR7,带宽来到了 1792GB/s。TBP 功耗为 600W,相比上代 RTX 4090 增加了 150W。

  三、理论跑分

  接下来就进入理论测试环节,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡属于高端定位,自带双 BIOS 切换和超频功能,所以测试之前必须先介绍一下索泰官方这次更新的 FireStorm 超频应用,它允许用户实时查看显卡状态,并进行自定义性能调节和双 BIOS 切换。

  进入主页,FireStorm 应用整体采用了黑金配色,默认展示性能标签页内容。顶部显示有显卡的几个核心数据,下方则可以对显卡、显存频率,电压以及功耗等指标进行自定义调节。实际性能测试环节,我们会将核心频率关联 BOOST 频率这项拉满。

  风扇标签页中提供了自动和手动风扇调节模式,也可以通过曲线模式更精细化调节风扇转速曲线。右侧还有外观部分提到的双 BIOS 切换开关,切换时会弹出提示弹窗,告诉用户当前模式状态及要切换的模式,确认切换模式则需要重启系统生效。

  此外,FireStorm 应用还给到了用户更加全面的显卡信息展示和灯效控制,设置标签中还允许用户进行界面的一些人性化设置。具体的功能大家可以在购买索泰 50 系显卡后自行体验,这里就不展开了。拿到的版本是 5.0.0.001C,官网正式版的 FireStorm 版本号可能会与我们有所区别。

  先看烤机,单烤甜甜圈 20 分钟,GPU 的核心温度稳定在 75.9℃左右,显卡频率 2595MHz,功耗稳定在 575W 左右,和公版保持一致。

  在 3DMark Time Spy DX12 测试中,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡分数达到了 49004 分,作为对比 GeForce RTX 4090 公版的分数为 34725 分,提升幅度达到了 41.1%,差距着实不小。

  而在 3D Mark Time Spy Extreme DX12 测试中,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡分数达到了 26112 分,作为对比 GeForce RTX 4090 公版的分数为 19924 分,提升幅度达到了 31%。

  在 3DMark Portal Royal 实时光追测试中,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡的综合分为 36239 分,作为对比 GeForce RTX 4090 公版的分数为 25080 分,提升幅度达到了 44.5%。

  从上述测试来看,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡相较于上一代 RTX 4090 D 的提升幅度一点不小,30%-45% 左右的理论性能增幅,足以说明它在图形性能上的迅猛迭代。

  四、游戏实测

  虽然 NVIDIA 官方宣称首批支持 DLSS 4 的游戏高达 75 款,不过目前能够顺利开启 DLSS 4 相关选项的游戏非常有限,所以多数主流游戏我们依旧测试的是 DLSS 3 和帧生成的表现,然后通过在更新升级后性能要求大幅提升的而在 2K 分辨率 + 高画质下则跑到了平均 634 帧的游戏帧数,1% Low 帧提升到 240 帧,喂饱 4K 和 2K 分辨率高刷屏无压力。

  接下来是一款“优化出色”的端游

  在 4K 分辨率 + 极致画质 + TAA 抗锯齿下,游戏平均帧数为 168 帧,1% Low 帧 124 帧;

  在 4K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 165 帧,1% Low 帧 128 帧;

  在 2K 分辨率 + 极致画质 + 上采样抗锯齿下,游戏平均帧数为 231 帧,1% Low 帧 161 帧;

  在 2K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 190 帧,1% Low 帧 148 帧;

  在 5090 D 的加持下,无论 2K 还是 4K 分辨率下,1% Low 帧都超过了 120 帧,对比上代 RTX 4090 D 在 4K 分辨率下 100 帧左右的游戏平均帧,提升相当明显。

  通过

  在 4K 分辨率 + 最高画质下,游戏平均帧数为 244 帧;

  在 2K 分辨率 + 极致画质下,游戏平均帧数为 373 帧;

  相比上一代 RTX 4090,4K 和 2K 分辨率下的游戏平均帧数提升分别达到了 35.8% 和 46%。

  在 4K 分辨率 + 极端画质下,游戏平均帧数为 205 帧,1% Low 帧 102 帧;

  在 2K 分辨率 + 极端画质下,游戏平均帧数为 253 帧,1% Low 帧 105 帧;

  相比上一代 RTX 4090,4K 和 2K 分辨率下的游戏平均帧数提升分别达到了 28% 和 38%。

  接下来是支持 DLSS 3 技术的光追游戏,首先是

  在 4K 分辨率 + 极高画质下,游戏平均帧数为 190 帧,1% Low 帧 80 帧;

  在 4K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 166 帧,1% Low 帧 77 帧;

  相比上一代 RTX 4090,4K 默认和 4K 光追下的游戏平均帧数提升分别达到了 47.1% 和 47.3%,可以说是几乎提升了一半。

  在 2K 分辨率 + 极高画质下,游戏平均帧数为 255 帧,1% Low 帧 128 帧;

  在 4K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 209 帧,1% Low 帧 105 帧;

  相比上一代 RTX 4090,4K 默认和 4K 光追下的游戏平均帧数提升分别达到了 42.6% 和 53%。

  作为“众生平等”的代表游戏,黑神话对光线追踪和 DLSS 技术的支持非常深入,由此也造成了高分辨率下超高的硬件要求。在 4K 分辨率 + 超高全景光追的设置下,强如 RTX 5090 D 也只能跑到 30 帧,我们还是直接来看 DLSS 和帧生成加持下的表现好了。

  4K 分辨率 + 影视级画质 + 50% 超采样分辨率下,游戏平均帧数为 101 帧;

  4K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 133 帧;

  不开启光追选项下,以 4K 分辨率 + 影视级画质运行,游戏帧数来到了百帧以上,而开启高等级全景光追和帧生成之后,平均帧数更是突破了 130 帧,直接拥有电竞级体验。

  在 2K 分辨率 + 影视级画质 + 50% 超采样分辨率下,游戏平均帧数为 116 帧;

  在 2K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 178 帧;

  可以看到,2K 分辨率下不开光追的提升幅度比较有限,而开光追加帧生成的直接暴涨了 40 多帧,恐怖如斯。

  五、DLSS 4 游戏体验

  目前 RTX 40 系列已经支持的 DLSS 3 技术实际效果已经非常强大了,DLSS 4 在 DLSS 3 的技术上,再次提升了帧生成的性能潜力,运用全新的多帧生成技术,结合第五代 Tensor Core 的强大性能,利用 AI 为每个渲染帧生成至多 3 个额外帧,从而大幅提升游戏的 FPS 水平。

  DLSS 4 配合全套 DLSS 技术,包括光线重建、超分辨率以及 DLAA 等功能,最多可实现传统图像渲染的 8 倍帧率。拥有 DLSS 4 技术的游戏,玩家使用 RTX 5090 D 可轻松解锁 4K 240 FPS 全景光追的满血性能体验。

  多帧生成技术还可配合 NVIDIA Reflex 低延迟技术保持较低的游戏延迟,让游戏的操作和响应影响很小。毕竟 GPU 为每个渲染帧计算时,都设计到超分辨率、光线重建和多帧生成等多维度,延迟的增加不可避免。不过,GeForce RTX 50 系列的第 5 代 Tensor Core 在 AI 处理性能上提升了 2.5 倍,因此游戏的延迟变化很小,具体我们将在下面的游戏实例中为大家演示。

  Blackwell 显示引擎也在 DLSS 4 技术发挥了重要作用,通过提升其像素处理能力,让游戏在更高分辨率和刷新率下满足 DLSS 4 技术的要求,最高可提升 1 倍的像素处理能力。

  DLSS 4 技术还带来了模型架构的重大升级,DLSS 光线重建、DLSS 超分辨率和 DLAA 特性均由首个实时 Transformer 模型驱动,并用来提升生成像素的质量,它支持通过自注意力操作评估整个帧几多个帧中每个像素的重要程度,更好理解场景关系,让生成的像素具有更好稳定性、更少的伪影、更丰富的运动细节和平滑边缘。

  官方表示,目前已有超过 75 款支持 DLSS 帧生成技术的游戏和应用可在 GeForce RTX 50 系列 GPU 上升级至 DLSS 多帧生成技术,不少主流 3A 大作也将于 50 系显卡正式发售后不久体验到 DLSS 4,包括选取了目前 2 款画质和 DLSS 4 支持最好的游戏

  在 4K 分辨率超级光追画质下,游戏平均帧数为 60 帧;

  在 4K 分辨率超速光追画质下,游戏平均帧数为 33 帧;

  在没有 DLSS 技术的支持下,这款游戏在 4K 分辨率 + 光追画质下的图形性能压力山大,5090 D 这样的卡皇只能勉强维持在 60 帧,路径光追下帧数更是直接折半。

  如果不开光追和 DLSS,采用 4K 分辨率 + 超级画质,游戏平均帧数的表现还可以,能达到 116 帧左右。

  接着我们看下多帧生成的选项,打开帧生成选项后,下面多出了一个多帧生成的倍率选择项,即 DLSS Multi Frame Generation,可选择 2x、3x 和 4x 这 3 种生成倍率。

  我们直接上最强的 4K 分辨率 + 路径光追,并选择 DLSS 性能档,依次切换 2x、3x 和 4x 的多帧生成选项,从测试结果来看,游戏平均帧数的提升相当明显,2x 下就有 164 帧,比不开光追和 DLSS 的 4K + 超级画质帧数还要高出近 50 帧,3x 多帧生成下更是突破 200 帧,而 4x 多帧生成下 292 帧的游戏平均帧数放在一起那是根本不敢想的水平。

  单从性能表现上看,DLSS 4 技术可以说开辟了一条游戏性能发展的新赛道,它不再执着于传统光栅性能的提升,而是借助 AI 和补帧技术,为光追游戏提供跨越式的性能提升,而且越吃性能的游戏收益越大。

  当然,无论是何种形式的插帧,延迟的增加都不可避免,所以我们也实测了关闭和打开多帧生成后的延迟表现。

  在关闭帧生成选项的情况下,同一场景下 4K 超级画质和 4K 超级光追画质的游戏平均延迟分别为 15ms 和 18ms。

  而切换到超速光追画质后,依旧在同一场景下分别开启 2x、3x 和 4x 多帧生成,游戏平均延迟分别为 21ms、24ms 和 27ms。

  事实正面,帧生成确实会提升一定的游戏延迟,好在对于我们再来看而一旦我们开启光追选项,游戏平均帧数立刻会跌到无法流程游玩的水平:

  4K 分辨率 + 原生最高画质 + 光追下,游戏平均帧数为 40 帧,1% LOW 帧 37 帧;

  4K 分辨率 + 原生最高画质 + 路径光追下,游戏平均帧数为 28 帧,1% LOW 帧 25 帧;

  与此同时,大家应该也注意到开启光追后的游戏平均延迟会大幅提升,由原先的 36ms 提升到了 65ms 和 92ms,即使帧数勉强达到 30 帧的主机流畅线,游戏体验也很难舒适。那么 DLSS 4 技术能扳回一城吗?

  开启多帧生成后,局势立刻发生了逆转,2x、3x 和 4x 多帧生成下的游戏平均帧数分别为 132 帧、186 帧和 249 帧,虽然没有而在游戏平均延迟的表现上,开启多帧生成后帧数相比 4K + 路径光追下少了一半,来到 45ms,2x、3x 和 4x 多帧生成下的增幅和那说到延迟,新一代 NVIDIA Reflex 2 低延迟技术也可进一步降低游戏的延迟表现,提升操作手感和响应速度。过去四年里,NVIDIA Reflex 已集成到超过 100 款游戏中,可以将 PC 延迟降低 50%。新的 Reflex 2 将采用一项 Reflex Frame Warp 技术,通过把最新的鼠标输入指令及时同步给渲染帧,实时刷新和控制渲染出的游戏帧,可以说是定制化的低延迟调整了。

  NVIDIA Reflex 2 将在未来不仅支持主流竞技游戏和动作游戏,如那么多帧生成会影响画质吗?通俗点说就是会不会令画面变得更糊?为此我们也在

  4K 原生画质 + 路径光追;

  4K 最高画质 + DLSS 性能档+4x 帧生成

  4K 最高画质 + DLAA+4x 帧生成

  然后通过 NVIDIA ICAT 工具进行比较,在不放大的情况下 3 者根本看不出区别,所以我们挑选了 3 处细节进行放大对比。

  首先是警员手臂衣服上的 FBI 标志,左侧和右侧分别是 DLAA和原生 4K 画质,中间是 DLSS 性能,经过放大可以看到中间的 FB 文字更糊一点,但左右基本看不出清晰度上的区别。

  同样在警员的波浪卷发以及身旁右侧的树叶上也能看出中间的画面更糊一点,左右两边的却难以发现差距。

  也就是说对于物理渲染分辨率上的天然鸿沟,DLSS 技术肯定是无法完全弥补画质差距的,但只要保持和原生画质相同的分辨率,画面清晰度和细节几乎没有区别,更别说我们这种“盯帧式”比较有点吹毛求疵,正常游戏无论是 DLSS 性能档还是 DLAA都不会有糊成一片,锯齿满满这种明显问题,所以最主要的还是看游戏适配,在乎画质的小伙伴直接开启 DLAA 就好了。

  六、总结

  作为继任 RTX 4090 D 位置的新一代卡皇,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡不仅很好完成了使命,还通过 DLSS 4 技术开辟了全新的游戏性能赛道,在对画质、延迟影响非常有限的情况下,实现了性能的成倍提升,这对游戏体验来说无疑是一个进化。同时,DLSS 4 技术的成功也奠定了未来显卡性能的升级方向,即只渲染关键帧,过渡帧可通过 AI 补帧来填充,以最佳的性能表现呈现给玩家;光追游戏的开发者也能更好施展拳脚,优化更加轻松。

  索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡在设计上采用了经典的黑金配色,搭配硬朗装饰线条和 RGB Logo 灯,既有高端质感又能满足玩家个性化需求,应该说也选了一个不错的思路。双 BIOS 设计则兼顾了玩家对于运行噪音的顾虑,兼顾性能优先和静音环境优先的选择,值得肯定,毕竟将选择权交给玩家才是厂商该有的姿态。

下一篇:澎峰科技 + 海光 DCU:自研推理框架全面支持 De
上一篇:韩国检方就三星电子会长李在镕的无罪判决提出
返回顶部小火箭