在一个月前,快科技首发了RTX2080/Ti的全面评测,深刻感受到了新的图灵构架带来的巨大性能提升。
相较上一代Pascal构架的GTX 10系列显卡,Turing构架主要带来了如下改进:
1... 在一个月前,快科技首发了RTX2080/Ti的全面评测,深刻感受到了新的图灵构架带来的巨大性能提升。
相较上一代Pascal构架的GTX 10系列显卡,Turing构架主要带来了如下改进:
1、整合RT core,正式将实时光线追踪技术引入独立显卡,并改进了算法,大大降低了显卡的技术算量。RTX 2080 Ti 集成了68个RT Cores,每秒能处理100亿条光线,RTX-OPS性能十倍于GTX 1080 Ti。
2、整合Tensor core,带来了DLSS(深度学习超级采样抗锯齿)技术,能提供与TAA抗锯齿技术几乎相同的画质(未来会在画质上会超越TAA),但丝毫不会影响到游戏性能。按照NVIDIA官方的说法,RTX 2080 DLSS的性能比GTX 1080 TAA强了100%。
3、全新设计的流处理器构架:除了DLSS与RTX,图灵还改进了CUDA构架,每个流处理器在原来的FP32浮点单元的基础上,加入了一个INT32整数计算单元,可以将单个流处理器执行效率提升36%。
作为GPU领域12年来最大的变革,图灵在构架与性能上带给消费惊喜的同时,在价格上来也带来了足够的“惊喜”,公版RTX 2080 Ti价格直接破万,RTX 2080的价格也高达6499,这显然不是消费者愿意看到和接受的价格。于是在RTX 2080发售一个月之后的今天,RTX 2070也来到了我们面前。
RTX 2070并非是TU104-400的阉割品,而是采用了完整的TU106-400核心,这还是第一次NVIDIA专门为X70系列的显卡单独设计一个核心。
TU106-400晶体管规模达到了108亿,芯片面积445平方毫米,內建有2304个CUDA核心,分为3组GPC、18组TPC、36组SM阵列(每组64个CUDA核心),同时有144个纹理单元、64个ROP单元、288个Tensor核心、36个RT核心,二级缓存容量4MB,寄存器文件9MB,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。
RTX 2070使用了完整的TU106-400核心,核心基础频率1410MHz,加速公版1683MHz、非公版1620MHz,搭配8GB 14GHz GDDR6显存,带宽达到了448GB/s,相较GTX1070提升了75%。TDP方面非公标准版为175W,公版则是185W。
二、平台配置与理论性能测试:3DMark TS领先GTX 1070 50%
测试平台如下:
显卡我们选用的是影驰RTX 2070,该卡拥有2304个流处理器,基础频率1410MHz,加速频率1620MHz,TDP为215W(NVIDIA标准版TDP为175瓦)。
为了尽可能发挥显卡性能,不让处理器成为测试瓶颈,我们选择了i7-8086K平台,并将其超频至5.2GHz。
内存则使用了影驰HOF II DDR4-4000 8GBx2套装,测试中开启XMP保持4000MHz频率,时序为19-25-25-45 CR2。
测试采用的显示器是LG 38UC99,其支持的最高分辨率为3860X1600,测试中的4K分辨率就是指的这个分辨率。
3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,影驰RTX 2070图形分数达到了8903分,核心温度最高62℃,核心运行最高频率为1890MHz,显卡最大功耗达到了220W。
在4K分辨率3DMark Time Spy测试中,影驰RTX 2070图形分数为4139分,核心温度最高63℃,核心运行最高频率为1860MHz,显卡最大功耗达到了221W。
在3DMark Time Spy测试中,RTX 2070的成绩与GTX 1080 Ti较为接近,差距在5%之内;和GTX 1070相比,2K分辨率时能领先将近50%,4K分辨率时,领先幅度也有48%。
3DMark
3DMark Fire Strike测试程序诞生于2013年,其实已经不太适合用于最新显卡的测试,以下成绩并不一定能反应显卡的真实性能,仅供参考。
在3DMark Fire Strike Extreme测试中,影驰RTX 2070图形分数为10652分,最高温度尽然只有55度,但是由于预设频率较低,最高频率也只有1890MHz
在3DMark Fire Strike Ultra测试与Extreme类似,最高温度只有55度,最高频率1890MHz,影驰RTX 2070的图形分数则为5152分。
在3DMark Fire Strike Extreme测试中,RTX 2070的成绩与GTX 1080几乎完全相同,和GTX 1070相比,2K分辨率时能领先21%,4K分辨率时,领先幅度则只有17%。
三、1080P分辨率测试:落后GTX 1080 Ti 12%
GTA V
《GTA V》于2015年登陆PC平台,全平台的销量已经超过了1亿,算是 10年来最成功的单机大作,现在依然人气不减。
画质手动调为最高特效,开启MSAA 2X以及NVIDIA TXAA,分辨率为1920x1080,显存占用3422M。
在《GTA V》中,RTX 2070的帧率为110FPS,领先GTX 1070 15帧、领先GTX 1080 3帧、相比GTX 1080 Ti则落后了9帧。
刺客信条:起源
《刺客信条:起源》是由育碧制作并发行的《刺客信条》系列历史上规模最大的一个。本作采用开放地图沙盒玩法,游戏几乎呈现了整个古埃及王国,画质与风景无人能出其右。
测试时开启极高画质,分辨率为1920x1080。
在《刺客信条:起源》中,RTX 2070跑出了94FPS的帧率,比GTX 1070快了19帧,比GTX 1080快了14帧,与GTX 1080 Ti相比,也只是落后2帧。
孤岛惊魂5
《孤岛惊魂5》是一款由育碧(Ubisoft)制作的第一人称射击游戏。 已于2018年3月正式发售。
在《孤岛惊魂5》中,RTX 2070跑出了127FPS的帧率,比GTX 1070快了28帧,比GTX 1080快了10帧,与GTX 1080 Ti相比,则是落后了10帧。
古墓丽影10
画面设置为1920*1080 FXAA、DX12+默认非常高画质。
RTX 2070在此项测试中的帧数只有142FPS,仅仅领先GTX 1080 3帧,领先GTX 1070 24帧,相比GTX 1080 Ti则是落后了26帧。
古墓丽影11
《古墓丽影:暗影》是一款由Eidos Montreal工作室制作的动作冒险游戏, 本作是重启版《古墓丽影》的系列第三作,已于2018年9月15日正式发售。该游戏在后续的补丁中将提供对RTX系列显卡DLSS与光线追踪技术的支持。
守望先锋
《守望先锋》暴雪娱乐第一次涉足FPS领域的作品,2016年曾经火爆全球,影响力一度超过了LOL,即便是现在仍然还有相当数量的玩家活跃在游戏中。
由于游戏没有提供测试程序,我们选在训练关卡中从出生地一直向前奔跑,用Fraps记录20秒帧数。测试时打开100%渲染。
RTX 2070在这游戏中跑出了230FPS的帧率,比GTX 1070快了44帧,比GTX 1080快了19帧,相比GTX 1080 Ti则是落后了24帧。
四、2K分辨率测试:领先GTX 1080 12%
目前1080P显示器基本上都属于低端阶层,而 2K显示器普及率越来越高。正好RTX 2070的定位也是2K游戏,所以就非常有必要看看它在主流大作中2560*1440分辨率下如怎样的表现。
GTA V
RTX 2070在此项测试中的帧数只有142FPS,仅仅领先GTX 1080 3帧,领先GTX 1070 24帧,相比GTX 1080 Ti则是落后了26帧。
刺客信条:起源
在《刺客信条:起源中》RTX 2070跑出了75FPS的帧率,比GTX 1070快了19帧,比GTX 1080快了10帧,相比GTX 1080 Ti则是落后了5帧。
孤岛惊魂5
在《孤岛惊魂5》中,RTX 2070跑出了91FPS的帧率,比GTX 1070快了22帧,比GTX 1080快了8帧,相比GTX 1080 Ti则是落后了12帧。
古墓丽影10
在《古墓丽影10》中,RTX 2070跑出了100FPS的帧率,比GTX 1070快了26帧,比GTX 1080快了3帧,相比GTX 1080 Ti则是落后了21帧。
古墓丽影:暗影
在《古墓丽影:暗影》中,RTX 2070跑出了65FPS的帧率,比GTX 1070快了18帧,比GTX 1080快了5帧,相比GTX 1080 Ti则是落后了12帧。
绝地求生
在《绝地求生》中,RTX 2070跑出了108FPS的帧率,比GTX 1070快了34帧,比GTX 1080快了18帧,相比GTX 1080 Ti则是落后了13帧。
奇点灰烬
在《奇点灰烬》中,RTX 2070跑出了67FPS的帧率,比GTX 1070快了14帧,比GTX 1080快了2帧,相比GTX 1080 Ti则是落后了15帧。
五、超频测试:核心可以超180MHz 性能提升10%
相比RTX 2080,RTX 2070基础频率以及加速频率实在是太低,这也意味着RTX 2070将会有更多的超频潜力。
影驰RTX 2070默认TDP为215W,远高于标准版的175W,通过超频软件最高能拉到239W(BIOS限制)。
见过几次尝试,发现RTX 2070的核心频率提升160MHz,显存频率提升1000MHz时是可以通过稳定性测试的最高频率。
此时影驰RTX 2070的Boost频率达到了1800MHz,显存频率则为15000MHz,显存带宽480GB/s。
超频之后3DMark Time Spy图形分数从达到了9819分,相比默频时的8907提升了10%,核心频率更则达到了2055MHz,感觉我们手上这张影驰RTX2070体质非常一般,2055MHz也是大多数帕斯卡显卡稳定工作的极限频率。
温度相比默频仅仅只提升了一度,最高时也没超过63度,如此低温保证了GPU可以长时间保持在最高频率运行而不至于降频影响性能。
同时我们测试了超频后的显卡在《古墓丽影:暗影》中的表现。
在2560*1440分辨率时,开启最高特效,超频后的RTX 2070在《古墓丽影:暗影》中测试帧率达到了71FPS,相比默频的65FPS提升了有6帧,提升幅度达到了9%。
同频测试:流处理器执行效率相比帕斯卡提升16%
为了比较清晰的看到图灵与帕斯卡构架单个流处理器在执行效率方面的差异,我们将RTX 2070的boost频率超频至1733MHz,同时将显存频率将至10GHz,也就是在频率上完全与GTX1080相同,然后来做相应的对比测试。
降频后的RTX 2070 Boost频率与GTX 1080相同都为1733MHz,显存频率也是10GHz,显存带宽320GB/s。
在3DMark Time Spy测试中,降频后的RTX 2070图形分数为10230,比默频是低了115分,相比GTX 1080还是有19%的领先优势。
在3DMark Fire Strike Extreme测试中,降频后的RTX 2070图形分数为10230,比默频低了422分,相比GTX 1080要少355分。
其他游戏测试数据汇总如下(测试分辨率为2560*1440):
综合以上测试成绩,在同样的频率下,RTX 2070性能比GTX 1080强6%,考虑到其流处理器以及纹理材质单元数量比GTX1080要少10%。因此得出的结论是在同样的频率下,单个流处理器的执行效率上,图灵要比帕斯卡强16%。
同时我们也可以看出,在2K分辨率时,显存频率对于RTX 2070的影响并没有太大,核心频率提升113MHz,显存频率降低4000MHz之后,整体性能也只是降低了4%。
温度和功耗测试:满载温度控制在63度以内
1、温度测试
由于我们手上的几张帕斯卡显卡已在仓库存放许久,可能会出现硅脂干化等情况,因此不对这些显卡进行温度测试,我们在这里只对影驰RTX 2070进行测试,分别测试其在待机、3Dmark、以及Furmark的温度表现。测试时室温26度。
Furmark的参数设定为1920*1080分辨率,0AA。运行20分钟之后,影驰RTX 2070最高一直停留在62度,没有上升的迹象。
影驰RTX 2070的待机温度为29度,运行3DMark的最高温度为55度,进行Furmark烤机时的最高温度也没有超过62度。
2、功耗测试
影驰RTX 2070的TDP达到了215W,远高于GTX 1070的150W,让我们看看他们实际的表现如何。
分别测试待机与Furmark烤机功耗,测试所用的电源为酷冷至尊MasterWatt Maker1200W铂金电源。
另外,我们是使用超频平台进行测试,整个平台读出来的功耗会比默认频率时高出20W左右。
虽然影驰RTX 2070 TDP达到了215W,比GTX 1070的150W高了65瓦,但是在实际测试中,运行Furmark时整个平台的功耗也只有280W,低于GTX 1080的285W,相比GTX 1070的251W也仅仅是高出了29W。
在待机功耗方面,我们所测试的几张图灵显卡都要比帕斯卡高了5W左右,影驰RTX 2070也不例外。
DLSS与光线追踪测试:图灵优势所在 大幅抛离帕斯卡
Turing GPU构架的核心就是Tensor Core(深度计算单元)以及RT Core(光线追踪计算单元),让我们来看看影驰RTX 2070的表现如何。
1、DLSS测试
RTX集成了288个Tensor Cores,拥有60TFLOPs的半精度深度运算能力。深度学习与运算在科学运算、模型压缩、无人驾驶、AI学习方面已经有了非常成功的应用,对游戏显卡来说,以上应用场景显然都派不上用场,于是NVIDIA绞尽脑汁让它在游戏领域中也能体现自身的价值,这就是DLSS(深度学习超级采样抗锯齿技术)。
不用于以往任何抗锯齿技术,DLSS使用图灵核心中的Tensor单元来进行运算,不需要消耗CUDA单元,因此不会对显卡的性能造成任何损失,不过却能得到等同于TAA(时间抗锯齿)的画质。
在9月19号的RTX 2080/Ti首发评测中,我们已经对DLSS的画质做过分析与对比,结论就是开启DLSS抗锯齿的画质与TAA基本相同,整个画面的锯齿也基本上几乎看不到,在这里不再重复赘述。以下是RTX 2070 DLSS的性能对比测试:
GTX1080/1080Ti开启DLSS模式直接报错,只能运行TAA。
左边是1080ti,开启TAA模式测得3001分;右边是GTX1080,TAA模式下的分数为2524分。
这是RTX 2070的成绩,左边是开启了DLSS,分数为3896,右边是none AA的成绩,分数为3922。
从上图可以看出,在NOAA的情况下,RTX 2070要落后于GTX 1080Ti 5%左右。在开启DLSS之后,其性能几乎没有受到影响。而GTX 1080 Ti开启TAA之后,性能损失了30%左右,在帧率上大大落后与开启了DLSS的RTX 2070
2、光线追踪测试
RTX 2070集成了36个RT Cores,每秒能处理60亿条光线,而GTX1080只能靠CUDA来计算光线,每秒能处理8亿光线。下面我们通过星球大战DEMO来演示光线追踪的性能,这个DEMO可以为展现出一个如果科幻电影般的光影世界。
这是GTX1080的帧率截图,仅有5.2FPS,而且GPU已经满载。
这是RTX 2070的截图,由于这个DEMO锁了24帧,所以RTX2070的帧率也只能达到24FPS,但其GPU占用率只有68%,若不锁定帧数,RTX 2070应该的帧率应该能达到36FPS。也就是GTX 1080 7倍的性能。
总结:未来属于光线追踪 RTX 2070性价比秒杀一众帕斯卡
先说说光线追踪(ray tracing)。经过二个月来洗脑式的宣传,相信大家对它多少有了一些了解。简单的说,目前游戏里所有的光影效果全都是开发者提前设计好的模拟贴图效果,越复杂越接近真实的光影效果在设计上愈加繁琐,需要投入巨额开发成本以及大量开发时间,而实时光线追踪不仅可以大大缩减游戏的开发时间与成本,同时也能带来完全接近于真实世界的光影效果。因此实时光线追踪便成为了玩家与游戏开发者最终极的选择与梦想。
Turing GPU耗费了数量极为庞大的晶体管来实现实时光线追踪技术。以RTX 2070来说,它的流处理器数量比GTX 1080还要少10%,但是集成晶体管数量却从后者的72亿增加到了108亿,足足多了50%,这也是造成RTX显卡售价高昂的原因之一。 所以目前RTX2070以下级别的Turing GPU将不再集成ray tracing技术。
这并非说ray tracing在未来难以普及。2019年的7nm制程工艺相比现在的16(12)nm,在晶体管密度上将会有2倍以上的提升,届时中低端的显卡都有望整合RT Core。届时将会有更多支持实时光线追踪技术的游戏出现(毕竟可以节省大量游戏开发费用,还能带来更好的光影效果)。
就这一点来说,RTX 2070相比目前的GTX 1080/Ti而言,是一张能战未来的显卡。虽然当下RTX 2070在游戏性能上要落后GTX 1080 Ti 10%左右,不过未来完全可以凭借DLSS以及ray tracing实现大幅度翻盘。
一个月前上市的RTX2080/Ti虽然赚足了眼球,但是其6499/9999元的售价却让望而却步,引发了玩家集体吐槽。RTX 2070则是NVIDIA送给大家的甜点,3999元的售价低于市面上大部分非公版的GTX1080,这也是部分消费者能够接受的价格。
在性能方面,以老黄精准刀工打造出来的TU106核心,与RTX 2080正好保持这20%的性能差距。相较GTX 1070,在4K分辨率下能有将近40%的性能优势,比GTX 1080也要强了12%。
至于单个流处理器的执行效率,在我们的测试中,同频率下图灵构架的执行效率要比Pascal高了16%左右。
再来说我们测试用的这张影驰RTX 2070。这张显卡在散热方面表现给我们留下了非常不错的印象。6热管三风扇搭配三段式散热鳍片组成的散热系统,能将215W TDP的TU106-400核心温度控制在62度以内,即便是超频之后,最高温度也没有超过63度。
最后就让我们共同期待TU108核心的GTX 2060到来,在砍掉Tensor Core以及RT Core之后,GTX2060将专注于当下游戏的帧率提升,其芯片规模以及成本将会大幅降低,也许它才是真正能走进大众玩家机箱的图灵显卡。