Jon Peddie Research认为,虽然产品具有可比性,但一旦进入市场,供应商各自的产品并没有获得同样的成功,差异是明显的。今天英伟达的外接式GPU在固定工作站上的销量约占总销量的97%,而在移动GPU服务于蓬勃发展的移动工作站市场的背景下,这一数字甚至更高。
要想打破这一市场现状,需要英伟达出现问题,而AMD则必须完美执行虽然AMD的执行力并不完美,但该公司也很难掉链子。相反,AMD 的问题在于英伟达最近没有提供任何有意义的失误供 AMD 利用。因此,随着这两款竞争产品服务于相同(大约) 1,000 美元的 ASP 社区,我们在基准测试中看到了一些熟悉的结果组合。英伟达的 3D 图形性能胜过 AMD,但差距不大(尽管如果渲染方面也能达到同样的效果,这一点还有待商榷),而 AMD 更友好的定价使其在性价比方面与英伟达类似。
如果Radeon Pro W7700能够在性能和性价比上脱颖而出,那么双插槽与单插槽的问题就不会是一个重要的问题。而对很多人来说,可能还是一句“不在乎”。但是,如果两者在其他方面旗鼓相当(考虑到当今市场很大程度上将英伟达视为默认品牌),那么 W7700 更需要更多瓦特,并且可能会取代插槽(取决于主板) ,那么这对 Radeon Pro W7700 的前景并无帮助。
虽然这一轮更新不太可能显著提高市场份额,但如果您只是想配置新工作站的用户,这可能并不重要。对于高端市场,最大性能更可能是关键的购买标准,而在低端市场,价格将脱颖而出。在这些最新 GPU 的 1,000 美元级别中,性价比起着更重要的作用。因此,AMD 的性价比可能会激起用户的兴趣,而大多数买家将继续选择 4000 系列 RTX Ada,由于其在工作站供应商的配置选项中更广泛的可访问性,这一前景更有可能。专业买家的底线是什么?似乎没有明确的正确或错误答案,各种类型的用户都可以从两家供应商一代又一代的性能提升中受益。
英伟达和 AMD 的 GPU 组合在芯片开发和后续产品推出方面的一致性确实让笔者感到惊讶。也许不应该,相反,也许这是一种应该给人留下深刻印象的模式。因为当笔者停下来考虑现代 GPU(或 CPU)的生产这项艰巨的任务时,两家供应商在执行中很少出现失误,这一事实应该给人留下深刻的印象。虽然他们各自的产品并不总是处于平等的地位,但很少会看到一个人在没有得到对方及时和相应的回应的情况下,通过一些戏剧性的代际进步让对方完全措手不及。
因此,它一直在市场上寻找配备现代固定和移动工作站的专业级独立 GPU。英伟达的 Ada 和 AMD 的 RDNA 3 代的不断推出就证明了两者的新一代微架构往往非常接近。这两代产品都已经出现在各自以工作站为中心的 RTX 和 Radeon Pro 系列中,主要从高端开始,逐渐降低价格范围。
在过去的几个月里,英伟达最新的Ada一代GPU已经催生了两款适用于固定/桌面工作站的超高端产品——RTX 5000 Ada和RTX 6000 Ada GPU——以及大量适用于移动工作站的GPU模块。与此同时,AMD 推出了自己的两款高价选项:Radeon Pro W7900 和 W7800。这四款产品的零售价均超过 2,000 美元,超出了大多数工作站用户的承受能力。但它们的出现预示着这两家公司下一代产品的下一个可能价格点:利润丰厚的 1,000 美元范围。果然,两者都实现了这一期望,前者的 RTX 4000 Ada Generation,现在与后者的 Radeon Pro W7700 相媲美。
对 RTX 4000 Ada Generation 的显著硬件指标的扫描显示,其资源数量(尤其是 CUDA 核心、Tensor 核心和 RT 核心)与其前身 Ampere 一代 RTX A4000 基本相同。因此,RTX 4000 性能的大部分改进将归因于架构增强和/或更高频率的执行。一个值得注意的例外是峰值内存带宽,它实际上会降低。提高电源效率可能是设计选择背后的动机,因为外部接口上节省的电力可以用在其他地方(例如时钟)。但这也证明了 Ada 的架构效率(和板载缓存),它可以用更少的总带宽实现更高水平的性能。
表 1:RTX 4000 Ada 、 RTX 5000 Ada 及其前身 RTX A4000 的主要硬件指标。(来源:英伟达)
AMD 的 RDNA 3 代 Radeon Pro 预计将于 2023 年 4 月首次宣布部署工作站,最初由两个 SKU 组成:Radeon Pro W7800 和 W7900。与英伟达的第一代 Ada Generation RTX 6000 和 RTX 5000 一样,两者都非常昂贵,零售价分别约为 2,500 美元和 4,000 美元。但与英伟达一样,AMD 最近又进一步降低了价格曲线,W7700 的售价约为 1,000 美元。
RDNA 3 的进步也与 Ada 一样,沿着相同路径推动资源和性能:用于通用计算和 3D 图形的更快的流处理器,改进的(第二代)RT 加速器以加速渲染的路径跟踪,以及针对机器学习(训练和推理)进行调整的人工智能加速器。
表 2:RDNA 第三代 Radeon Pro W7700 的主要硬件指标。(来源:AMD)
RDNA 3 的 Radiance 显示引擎是 RDNA 3 与众不同的一项资源,与 RTX 的 DP 1.4a 相比,它支持更新、更高带宽的 DisplayPort 2.1。在物理层,DP 2.1 使带宽增加了一倍以上,意味着更高分辨率、更高刷新率、更多显示器,或三者的某种组合。它还允许选择 12 位 HDR 颜色 (4:4:4),无需色度二次采样,以满足最视觉精确的要求。
不过,W7700 还有一个方面与 RTX 4000 不同,这一点一目了然:后者是单宽度 PCI Express 卡,而前者是双宽度。外形尺寸选择反映了各自的散热和电源规格:RTX 4000 Ada 为 130W,Radeon Pro W7700 为 190W。当然,两者都使用单个 PCIe x16 插槽,但双宽卡会占用更多空间,并且可能会阻塞第二个 PCIe 插槽,具体取决于主板和机箱。大多数迷你或全尺寸塔式工作站将支持双宽卡(以及更高的功率要求)。有趣的是,正是在 GPU 频谱中这个 1000 美元左右、150W 左右的点上我们看到了这种外形尺寸差异。在此级别之上,两家供应商的产品都是双宽度的,在该级别之下,它们都是单宽度的。
单宽度 RTX 4000(左)和双宽度 Radeon Pro W7700(右)。
当谈到更传统的交互式 3D 图形时,SPECviewperf(最新的 2020 版本)仍然是 CAD 和其他专业视觉处理工作负载较多的应用程序的首选基准。使用 SPECviewperf 2020 进行测试得出以下结果,在相同的高性能系统上运行。交换 RTX 4000 Ada Generation、之前的 Ampere Generation RTX A4000 和 AMD Radeon Pro W7700。
RTX 5000 Ada Generation GPU 在 SPECviewperf 2020 视图集上的运行速度平均比 RTX A5000 快 56%(A6000 Ada Generation 大约快 73%)。
RTX 4000(和 5000)Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 分数,标准化为英伟达Ampere 一代 RTX A4000。
然而,当我们考虑性价比时,情况就发生了逆转,因为 AMD Radeon Pro W7700 的 ASP 更易于访问,使其比英伟达RTX 4000 Ada 更具优势。
RTX 4000(和 5000)Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 性价比得分,标准化为英伟达Ampere 一代 RTX A4000。
最后,从电源效率的角度来看,尽管在固定/有线工作站的环境中(对于大多数人来说)这是一个较小的问题。相反,RTX 4000 Ada 的每瓦分数较低,其较低的最大持续功耗使其每瓦性能领先于此处对比的所有同类 GPU。请记住,这些结果并不反映达到相应分数所消耗的实际功耗,而是反映电路板为确保热容限和电容限而可以消耗的持续功率限制。
RTX 4000(和 5000)Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 每瓦得分,标准化为英伟达Ampere 一代 RTX A4000。
虽然 3D 图形仍然是大多数视觉计算工作流程的基础,但它不再是唯一需要评估的 GPU 功能。随着片上光线追踪硬件的出现,以及 GPU 在通用计算和机器学习方面能力的不断提高,下一代 GPU 有更多的价值可供开发。
得益于普遍的应用程序支持、更快的 CPU,以及(特别是在本次评测中)GPU 加速和支持软件库,渲染曾经是一种奢侈品,现在在工作站市场中变得越来越容易使用。除了简单地提供比上一代 Ampere 芯片更多的 CUDA、RT 和 Tensor 核心之外,英伟达在转向 Ada 时还提高了每个核心的性能和功能(具有第四代 Tensor 核心和第三代 RT 核心架构)。例如,RT 核心本身已经升级,英伟达声称光线追踪吞吐量比 Ampere 提高了 2 至 3 倍。虽然 3D 图形处理主要依赖于 CUDA 核心,但它的渲染代表了利用所有三个核心功能的算法的十字路口。
考虑DLSS 3,它扩展了之前在 Ampere 和 Turing DLSS 以及 DLSS 2(Ampere 的前身)中利用的 AI/渲染协同作用。前面的算法利用机器学习来智能地填充像素或光线(其数量与渲染时的视口像素相关),从而缩短到达最终渲染图像所需的时间。在 Ada 中,DLSS 3 将其带入逻辑上的下一步,但是在时间域而不是空间域。DLSS 3 不是在同一帧内填充像素或光线,而是允许经过训练的神经网络创建中间帧,从而提高帧速率,同时减少暴力视觉处理。
RTX 4000 Ada 和上一代 RTX A4000 的测试结果充分证明了 Ada 在所有处理核心上的先进能力,前者在 Blender Cycles 基准测试中比后者高出 41%(三个场景分数的几何平均值),利润率甚至高于 SPECviewperf 2020 的 3D 图形。
RTX 4000 Ada 和 RTX 5000 Ada 的 Blender Cycles 渲染基准测试结果,标准化为 Ampere 一代 RTX A4000。
随着 Maxon 的 Cinebench 2024 的推出,笔者终于找到了比较英伟达和 AMD GPU 加速渲染的公平基础。前几代 Cinebench 或 Blender Cycles 或 LuxRender 等其他基准测试如果没有对供应商首选优化库(英伟达的 CUDA 或 AMD 最新的 HIP RT)的嵌入式支持,将使英伟达或 AMD 处于不利地位。另一方面,Cinebench 2024 现在支持两者,测试显示 RTX 4000 Ada 的性能比其前身 RTX A4000 高出 41%,而 Radeon Pro W7700 的帧速率约为后者的 85%。
RTX 4000 Ada 和 RTX AMD Radeon Pro W7700 的 Cinebench 2024 渲染基准测试结果,标准化为 Ampere 一代 RTX A4000。
虽然视觉处理(主要是 3D 图形,但越来越多的渲染)仍然是专业 GPU 工作负载的大部分,但加速其他计算已经扩大了其效用。如今,人工智能占据主导地位,GPU 通常被视为训练和推理的首选引擎。SPECworkstation 的 GPU 计算测试套件可以在一定程度上深入了解 GPU 对深度学习(使用 Caffe)和科学研究(使用 FAH 或 Folding@home)的益处,以及另一个使用 LuxRender 提供额外渲染数据点的套件。
在同一测试系统上运行 SPECworkstation 3.1,英伟达的 RTX 4000 Ada Generation 在 GPU 计算测试套件上的性能比其前身 RTX A4000 高出 20%。按绝对值计算,英伟达GPU 在特定于 GPU 的测试中的性能不会是最佳的,因为这些测试支持 OpenCL,而不是英伟达自己的 CUDA 加速库。然而,从一代又一代的角度来看,分数应该提供另一个合适的参考,表明 Ada 相对于 Ampere 的性能进步。
RTX 4000 Ada 和 RTX 5000 Ada 的 SPECworkstation 3.1 GPU 特定基准测试结果,标准化为 Ampere 一代 RTX A4000。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
微软资讯推荐
win10系统推荐
系统教程推荐