6月9日,我们终于迎来了GeForceRTXTi的发布,这款显卡的发布标志着截止目前GeForceRTX30系游戏卡“Ti家族”的成员全部补齐,今天给大家带来的是iGameGeForceRTXTiAdvancedOC8G显卡首测。 iGameGeForceRTXTiAdvancedOC8G 目前,已经推出的GeForceRTX//均已推出Ti系列,当然也不排除后续NVIDIA会推出内容创作卡GeForceRTXTi的可能性。但就以目前的数量来看,“Ti家族”还没这么整整齐齐过,并且在售显卡达到7款,而NVIDIA方面也没有要停售哪款显卡的迹象。 iGameGeForceRTXTiAdvancedOC8G 从售价来看,新推出的GeForceRTXTi与GeForceRTXTi分别为元起和元起,确实填充了价格空位,但从GeForceRTXTi的性能提升来看,也着实对得起这份价格,所以变相涨价的说法似乎不成立。 iGameGeForceRTXTiAdvancedOC8G GeForceRTX此前的发布价格为元,GeForceRTXTi的发售价格为元,差价元对于显卡来说算是非常小了,所以今天我们就来看看这款iGameGeForceRTXTiAdvancedOC8G的性能到底如何,在测试开始前,笔者先将这款显卡的特点列出方便大家阅读: 性能较公版有大幅提升一键超频按钮方便快捷总的来说,GeForceRTXTi的定价介于自家产品之间,而性能则介于对手产品之间,身份着实复杂。iGameGeForceRTXTiAdvancedOC8G这张卡,从外观来讲,Advanced系列的整体升级让原本的合金骨架更具有力量感,显卡两侧进行了简约无遮挡的处理,可进一步提升散热效率。其标志性的能量核心加上精心设计的视觉暂留效果,真的让人忍不住会多看上几眼。 01GeForceRTXTiGA核心的第二张显卡 在核心架构上,GeForceRTXTi是采用GA核心的第二张卡,官方白皮书上对比的对象为GeForceRTXSUPER,相较于上一代的NVIDIATuring架构,NVIDIAAmpere架构下的GeForceRTXTi每个时钟执行2次着色器运算,而Turing为1次,RTXTi的着色器性能达到22TFLOPS单精度性能,而Turing为9TFLOPS。 RTXTi新老两代显卡算力对比 NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RTCore达到42RTTFLOPS,而Turing为24RTTFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。 第三代TensorCore可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达TensorTFLOPS,而Turing为72TensorTFLOPS。 GeForceRTXTi采用了GA核心,与GeForceRTX相同,不过NVIDIA官方并没有给出GA核心架构图,我们仍以GA来做讲解。 完整的GA核心 完整的GAGPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForceRTXTi的CUDA数量是个,共有48个SM单元,也就是3个GPC24个TPC,而刚刚发布的GeForceRTXTi共有40个TPC80个SM单元,这也是两款芯片的差距所在。 公版显卡参数表 为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForceRTX与GeForceRTXTi的差距不大,相差的两个SM单元,和刚刚发布的GeForceRTXTi情况基本相同,也就是1组TPC,个CUDA。只不过GeForceRTXTi更接近GeForceRTX,而根据参数来看GeForceRTXTi与GeForceRTX还有一定差距。 GDDR6X 另外GeForceRTXTi的显存虽然依旧是8GB,但已经由GDDR6更换为GDDR6X,两者的区别主要在于频率和带宽上,同频下实现更高的显存带宽可以降低成本和功耗,另外在相同时间内GDDR6X可以比GDDR6传输多2倍的数据。这对于需要大量数据负载的工作尤为重要,如光线追踪的游戏、AI学习和8K视频渲染。 02NVIDIAAmpere架构GA解析 iGameGeForceRTXTiAdvancedOC8G采用了GA核心,拥有亿(00million)个晶体管,平方毫米的面积,基于三星的8nmNVIDIA定制工艺,来自Micron的GDDR6X显存,这里与GeForceRTX的GDDR6有所区别。 本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。 而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的从1:1变为2:1。 GeForceRTXTi共有个CUDA,其实它有个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了的CUDA数量。 而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。 在去年与GeForceRTX30系显卡一同发布的还有一项新技术——RTXIO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。 虽然随着NVMeSSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。 传统的数据交换 在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTXIO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。 RTXIO可以极大解放CPU负担 当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTXIO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。 同时搭配新增的HDMI2.1接口,可以支持单线8K的视频输出,而上一代HDMI2.0仅支持4K98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。 03iGameGeForceRTXTiAdvancedOC8G外观 外观部分,iGameGeForceRTXTiAdvancedOC8G属于iGame家族中次旗舰系列,其标志性的“能量核心”在GeForceRTX30系显卡中也做了较大改动。 iGameGeForceRTXTiAdvancedOC8G iGameGeForceRTXTiAdvancedOC8G的尺寸为.5××60mm,整体视觉效果较为狭长,更符合其隐匿于黑暗中的“视觉刺客”定位。 黑暗中的眼睛 由于iGameGeForceRTXTiAdvancedOC8G显卡除了中间风扇部位的灯光,两侧均为无光设计,所以如果你的机箱内部光源不多,它就像猎手的眼睛一样,隐匿于黑暗;如果你的机箱内光源充足,显露出灰色外甲部分,则更像蓄势待发的猛兽,肌肉感十足。 暗光环境下隐匿于黑暗 亮光环境下蓄势待发的猛兽 Advanced系列中央区域的灯光使用内嵌型矩阵打孔设计,让灯光效果不会逸散,同时采用双灯环增加了整体质感。 iGamePCI-E4.0×16显卡延长线 iGameGeForceRTXTiAdvancedOC8G这款显卡主要的灯效均来自于中部的能量核心,所以竖装显卡是最适合不过的,但很多用户对于PCI-E显卡延长线会有顾虑,主要在于是否会影响数据传输速度。所以在本次评测中,iGame随卡送测了一根PCI-E4.0×16的显卡延长线,我们在后面的理论测试中也会测试是否会有性能损耗。 视觉暂留效果 另外iGameGeForceRTXTiAdvancedOC8G中间风扇在高速旋转时,会有视觉暂留的效果,即风扇在高速旋转时仍给人保持静止状态、缓慢转动或“无限”扇叶的错觉,这一技术需要灯光频闪与风扇转速协同,达到某一契合点来实现。虽然并非难点技术攻克,但也证明iGame对于细节的严苛把控。 iGameGeForceRTXTiAdvancedOC8G正面风扇 iGameGeForceRTXTiAdvancedOC8G显卡正面的三个风扇扇叶也有所不同,中间能量核心部位为9叶较小的风扇,而两侧为13叶边缘折角的“捕风手”风扇,可将气旋压入散热器内实现风压及进风量的进一步提升。 iGameGeForceRTXTiAdvancedOC8G背板 iGameGeForceRTXTiAdvancedOC8G显卡背面为一体式金属背板,中间为iGamelogo,由于显卡本身的散热系统非常出色,所以背板芯片部位及尾部并没有镂空设计,整体性更强。 iGameGeForceRTXTiAdvancedOC8G iGameGeForceRTXTiAdvancedOC8G的显卡厚度达到了60mm,采用SilverShark银鲨散热器2.0,内部全覆盖式散热底座来优化散热面积,配合5根8mm纯铜热管,对比上一代整体散热面积增大50% iGameGeForceRTXTiAdvancedOC8G供电接口 Advanced系列的整体升级让原本的合金骨架更具有力量感,显卡两侧进行了简约无遮挡的处理,可进一步提升散热效率。在供电接口上,iGameGeForceRTXTiAdvancedOC8G的TDP功耗为W/W,推荐W及以上电源。 iGameGeForceRTXTiAdvancedOC8G视频输出接口 iGameGeForceRTXTiAdvancedOC8G在视频接口方面的配置依旧为DP1.4a*3+HDMI2.1*1的4接口设计,另外由于新的HDMI2.1协议,最高已可支持单线8K的视频输出,接口上方的一键超频按钮可在默认的MHz与MHz之间切换。 04iGameCenter软件 想要玩转iGameGeForceRTXTiAdvancedOC8G一定要下载iGameCenter这款官方软件,这款软件不仅包含了灯光调节,数据实时监控,还有超频等功能。 首先iGameCenter软件的第一栏会显示电脑的基本信息,包括CPU、GPU、内存、网络、风扇等,做到实时监控。 第二栏会详细展示显卡的功能设置,在主页面中可进行手动超频及风扇散热调整。这里注意,如果没有超频经验的用户切勿随意拖动数值,尤其是大部分用户见到这种数值条喜欢直接拉满…… 软件的第三栏可以自定义调节灯光,具体的种类就不在这里介绍了,除了灯光模式,还支持调节亮度、速度以及流动方向。 最后一栏则是各种硬件的详细参数,这里相较第一栏的硬件整体状态更加细分,包括各个风扇的转速、GPU使用率、显存使用率、显存使用情况等等。 DMARK理论性能测试 首先介绍一下测试平台,为了保证此次评测能够发挥iGameGeForceRTXTiAdvancedOC8G显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。 在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。 GPU-Z参数 首先看一下GPU-Z的参数,iGameGeForceRTXTiAdvancedOC8G采用GA核心,三星8nm工艺,芯片面积平方毫米,拥有个CUDA,Boost频率为MHz,而公版为MHz频率。采用8GBGDDR6X显存,位宽为bit,显存带宽达到了.3GB/s,光栅单元和纹理单元为96和。 下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在P、2K、4K的理论性能,取显卡分数实际测试结果如下: 3DMARKFS套装测试 在针对显卡DX11性能的3DMARKFS套装测试中,我们选择了上代和本代的5张显卡进行分值对比,以便能更好的反应iGameGeForceRTXTiAdvancedOC8G的性能水平。 可以看到iGameGeForceRTXTiAdvancedOC8G的性能显然更接近GeForceRTX,整体提升10%左右;对比GeForceRTX的差距为17%左右;相比上一代的GeForceRTXSUPER提升45%左右。iGame的ADOC系列属于家族中次旗舰队列,用料及设计都绝非一般,而在对比公版中仍然没有讨到便宜,可见此次GeForceRTXTi公版卡的素质亦属于旗舰系列了。 3DMARKTS套装测试 而在针对DX12环境下的TimeSpy和TimeSpyExtreme测试中,iGameGeForceRTXTiAdvancedOC8G的分数提升稍弱,相比GeForceRTX提升8%左右,对比公版提升1%左右。而对比GeForceRTX的分数差距为21%左右;对比上一代GeForceRTXSUPER的分数要高出43%左右。 3DMARK光追测试 PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中iGameGeForceRTXTiAdvancedOC8G的分数表现更贴近GeForceRTX,分数提升为8%左右,相比公版提升为1.4%左右;对比GeForceRTX的分数差距为29%左右;对比上一代GeForceRTXSUPER的分数提升则非常大,约为52%。 显卡直插主板PCIE4.0×16接口测试结果 使用iGamePCI-E4.0×16显卡延长线测试结果 针对此次送测的iGamePCI-E4.0×16显卡延长线,我们也对带宽进行了测试,出乎意料的是,在使用延长线后的速度比不使用还要快……而测试结果也绝对没有搞混。不过虽然两次测试相差了0.02GB/s,但基本属于正常波动范围。所以这条iGamePCI-E4.0×16显卡延长线玩家可以放心使用,不会对速度传输速度造成影响。 这是比较理想的等差数列 另外我们对比了一组比较有意思的数据,综合来看目前GeForceRTX30系显卡性能,形成等差数列的游戏卡型号分别为RTX、RTXTi、RTXTi以及RTX,所以个人来看GeForceRTX与GeForceRTXTi的型号会有些许矛盾,不知道NVIDIA后续是否会有停产GeForceRTX的打算。 06游戏性能测试 在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。 另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。 《刺客信条:英灵殿》游戏测试 在游戏实测中可以看到iGameGeForceRTXTiAdvancedOC8G和GeForceRTX的帧数差距平均下来为3%左右。而对比GeForceRTX的分数差距整体在10%左右。 《德军总部新血脉》游戏测试 《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,iGameGeForceRTXTiAdvancedOC8G与GeForceRTX的差距约为4%。 而相比GeForceRTX的帧数差距综合为13%左右,但可以发现其实在P分辨率下,CPU已经限制了显卡的发挥,而在4K分辨率下GeForceRTX能领先iGameGeForceRTXTiAdvancedOC8G约22%的帧数。 《孤岛惊魂5》游戏测试 《孤岛惊魂5》同样算是优化比较到位的3A大作,在这款游戏中CPU的瓶颈更加明显,P分辨率下三款显卡的成绩几乎相同,在2K和4K分辨率下比较能反应真实水平,iGameGeForceRTXTiAdvancedOC8G相比GeForceRTX提升约为8%。 《无主之地3》游戏测试 《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律,其中iGameGeForceRTXTiAdvancedOC8G相比GeForceRTX提升为7%;相比GeForceRTX的分数差距为24%。 《光明记忆:无限》游戏测试 《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX最高/DLSS质量”模式下进行。整体的分数分布情况与《无主之地3》非常相似。 《边境》游戏测试 在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。 07功耗及温度测试 功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。 功耗测试(点击查看大图) iGameGeForceRTXTiAdvancedOC8G经过我们的实测在满载状态下单卡功耗为W左右,由于这款显卡自带一键超频按钮,官方给出的数据为TDP功耗W/W,也就是一键超频前后,基本与实测符合,建议搭配W及以上电源。 温度对比 温度方面,本次的iGameGeForceRTXTiAdvancedOC8G经过15分钟左右的拷机,温度稳定为67℃左右,相比公版低了11℃左右,同时显存温度也更低,达到了80℃,而公版为86℃左右。 08部分游戏光追及DLSS效果展示 上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。 《赛博朋克》RTXON 《赛博朋克》RTXOFF 在《赛博朋克》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。 RTXON RTXOFF 在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。 《堡垒之夜》RTXON 《堡垒之夜》RTXOFF 堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。 《魔兽世界9.0》RTXON 《魔兽世界9.0》RTXOFF 《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。 《控制》RTXON 《控制》RTXOFF 《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。 《赛博朋克》DLSS模式对比 DLSS的对比测试我们选择《赛博朋克》这款游戏,2K/RTXON/DLSS关闭原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。 《逆水寒》DLSS模式对比 画质说明 在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。 首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。 09软硬兼施铸就Ampere 好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家
|