MCPLive > 杂志文章 > NVIDIA GeForce GTX 1060详解

NVIDIA GeForce GTX 1060详解

2016-08-11夏松《微型计算机》2016年8月上

在旗舰级基于GP104核心的GTX 1080和1070发布的一个月后,Pascal架构的甜点级产品GP106才姗姗来迟。也许是受了AMD RX 480的市场火爆的刺激,GTX 1060从公布之日起,其价格与规格无不让人联想到它直接指向的目标就是RX 480。NVIDIA更是在宣传资料中声称GTX 1060的性能将超越GTX 980,这又为GTX 1060戴上了耀眼的光环。不到2000元的公版起售价,比很多非公版GTX 970还要低,却拥有比GTX 980还强的性能?NVIDIA是开了一个玩笑,还是真的为消费者带来了一道非常可口的甜点大餐?

外观解析,还是泰坦皮

在外观上,GTX 1060仍然采用了与公版GTX 1080、GTX 1070一样的“泰坦皮”设计,银白色的金属质感冲击力非常强。不过和GTX 1080、1070等不一样的是,GTX 1060将正面均热板前的透明亚克力板去掉了,直接将均热板裸露在外,少了几分塑料感,却多出了一分刚毅,我认为这种设计相比GTX 1080/1070无论是在外观还是散热性上都要优秀不少。由于在外观上它几乎是一脉继承了GTX 1080的所有特质,在之前GTX 1080的深度测试文章中我们已经有过针对GP106显卡外观及散热设计的详细讲解,在这里就不赘述了。不过有一点需要特别指出的是,GTX 1060取消了SLI多卡互联的桥接金手指接口。虽然NVIDIA的解释是GTX 1060这种档次的显卡基本不需要SLI多卡互联,但怎么看都有些掩耳盗铃的味道,毕竟GTX 1060的SLI模式极有可能逼近甚至达到GTX 1080的水准,而价格却低不少。小小猜测一下,NVIDIA会不会是因为阻止玩家组双卡实现更实惠的GTX 1080的性能而故意为之的呢?

泰坦系的全金属外壳

泰坦系的全金属外壳

 散热性能优秀的均热板

 散热性能优秀的均热板

厚实的尾部散热片

厚实的尾部散热片

核心解析,中庸强劲

GP106核心初窥

Pascal架构GP106芯片主要有以下几个明显的特质。

★超过10组全新设计的,包含了几何引擎、光栅化引擎等的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PE。同时还管控5组基本的SM渲染单元,每个SM单元包含8个负责处理材质以及特种运算任务的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。

★制程采用了来自台积电的16nm FINFET工艺。

★拥有3个64bit组(两个32bit为一组)的显存控制器,总计192bit位宽。每个32bit的显存控制器包含了8个ROPs单元和256KB二级缓存。所以,我们在终的规格表中可以看到GTX 1060拥有共计48个ROPs单元和1.5M二级缓存。

★针对PolyMorph Engine,PE引擎进行了改良。现在PE包含了为VR设计的The Simultaneous Multi-Projection Engine。在高负荷情况下,SMP引擎可以大量减少VR所需的渲染工作量。

可以看出,GTX 1060所采用的GP106核心仍然基于全新的Pascal架构,采用全新的16nm工艺制程。在16nm工艺的强大优势之下,GP106核心内部集成了44亿晶体管。虽然逊色于同为16nm工艺的GP104的72亿,却远远超过了相同定位的上一代产品GTX 960的29亿,超越幅度达到了50%,而核心面积却只有Maxwell架构的GTX 960的88%左右。

从规格表上可以看到,GTX 1060核心的流处理器数量为1280个,正好是GTX 1080的一半。纹理单元为106个,ROPs数量为48个,并且由三个64bit的显存控制单元组建了192bit/192GBps的显存通道,容量大小为6GB。而且单从频率上来看的话,其基础频率1506MHz,大Boost频率1703MHz的范围更是来势汹汹,遥遥领先上一代产品GTX 960。单从GP 106的规格来看的话,无疑它已经绝对领先于GTX 960,各项指标均有大幅度的提高。如果仅仅从规格上来看,GTX 1060相比GTX 980在CUDA数量上要逊色不少,接近800的CUDA流处理器数量缺口,能否凭借更高的频率、更高效率的核心架构以及更先进的制程工艺来弥补呢?NVIDIA宣称的超越GTX 980的性能是否能实现?我们将在稍后的测试中一一验证。

GP106核心

GP106核心

源自GP104的Simultaneous Multi-Projection硬件多重投影引擎

源自GP104的Simultaneous Multi-Projection硬件多重投影引擎

Pascal架构的核心技术

关于Pascal架构核心的主要特征技术解析,我们在此前的报道中已经有过详细的讲解。在这里,我们只简单总结一下GP106所具备的几项特征技术,更详细的技术解析,请参考本刊2016年6月下刊《NVIDIA GTX 1080显卡深度品评》一文。

1.硬件多重投影引擎SIMULTANEOUS MULTI-PROJECTION

VRWorks无疑是伴随这带Pascal架构而来的重点软件技术创新,其中有关图形渲染的重点则是SIMULTANEOUS MULTI-PROJECTION(简称SMP,硬件多重投影)。SMP可以让基于Pascal架构的GPU渲染基于16个不同角度的画面,并根据需求分别呈现。为了高效率的实现多角度画面同步投射,NVIDIA不仅更新了算法,还在Pascal架构GPU中集成了SMP硬件引擎模块,每组SMs一个。在VR兴起之后,我们的图形渲染势必要从单一显示器画面像双眼画面过度。这其中涉及到画面切割、画面畸变、画面多角度渲染的问题。NVIDIA优化了有关镜头畸变的算法,能够减少40%左右的无用(不会显示在头盔视野里)的图形渲染。更重要的是,NVIDIA借助SMP,实现了Single Pass Stereo这一重要功能。SPS能够让原本需要分别渲染的左右眼画面,简化到只需要渲染一个眼睛所见的画面,另一画面由SMP硬件单元通过特定的算法合成。此时,SMP具有硬件、软件协作的高效率开始发挥作用,多角度引擎,让另一角度画面的合成几乎不再额外消耗显卡计算资源。如此一来,在VR头显上输出同样的画面,GP106的工作量能瞬间减半,理论上帧率自然可以大幅度提升,高近2倍。当然,SMP的优势不仅如此,在对畸变的处理上也有裨益,能够降低多连屏或曲面屏用户面临的画面拉伸问题,可以根据需要,更真实地模拟人眼环视效果。

2.动态负载平衡(DYNAMIC LOAD BALANCING)

在Pascal架构上,NVIDIA宣称弥补了异步运算能力不足的问题,并强调Pascal架构原生支持异步运算,包括基于GPU的物理加速、音频处理、渲染帧的后期处理以及VR中的异步时间扭曲算法中都可以用到异步运算。但NVIDIA并没有给出什么实际的测试数据来支撑,反倒是在动态负载平衡(DYNAMIC LOAD BALANCING)的原理上废了一番口舌。不得不说,新的动态平衡机制赋予了Pascal架构更灵活的处理能力,无论是图形渲染的,还是计算相关的任务都能够互不影响。任务拆分并行计算本就是异步运算的精髓,从这一点来看新的Pascal架构无疑比Maxwell强了不少。

3.GPU Boost 3.0

在以往的Boost 2.0上,NVIDIA提出了根据功率动态调整频率的设计,在当时看来这是已经是非常先进的方式,能尽可能的维持GPU的高频率。但由于这个机制太过线性,导致GPU在各个电压点上,没有办法大程度挖掘潜力。而Boost3.0就是针对此项进行了改进,它可以设置各个电压点的频率偏移,使频率偏移与单个电压点一一对应。这样就可以使得GPU的频率达在每个设定电压点下获得大限度的挖掘,压榨出GPU的所有剩余性能。

4.Ansel

你要问我Ansel的意义的话,我倒真心觉得这是NVIDIA为艺术类玩家开发的新玩具,甚至是新的创作工具。实际上在很久以前,就有不少本职专业摄影师的游戏玩家提出这种需求,他们需要更好的工具来实现游戏中的艺术创作,而不是简单的截图工具。很显然,NVIDIA的Ansel给了他们这个机会。而且其灵活性甚至比现实世界更高,现实中去不了的取景点它也能完美驾驭。实际上,Ansel的名字就来自伟大的摄影师Ansel Adams,照顾艺术家们的意图显露无疑……目前,如《全境封锁》、《见证者》、《巫师3》等已经有不少游戏宣布提供对ansel的支持,能够满足玩家们自由创作的需求。更重要的是NVIDIA宣称支持Ansel基本没有难度,NVIDIA已经完成了功能开发,游戏开发商只需加入简单的少量代码就能支持。

5.VRworks Audio+Touch

VR是NVIDIA、AMD争夺的未来新焦点,从上代Maxwell开始,NVIDIA就已经在图形计算上针对VR的需求优化,比如畸变图形的渲染显示等等。这一次Pascal发布,更是一口气推出了VRWorks开发包。前面我们已经说过它有关图形渲染的功能,实际上它还包含了音频拟真技术—VRWorks Audio。VRWorks Audio音频还原借鉴了光线追踪渲染的思路,实现虚拟场景中的声音追踪,可以模拟声音在场景内的互动映射、反射等等,仿真出现实中声音碰到障碍物的效果,让你听到的声音更准确的契合VR场景,让沉侵体验更加逼真。

当然,要营造身临其境的VR体验,光有视觉和听觉还不够,还要有触觉才能实现三位一体。所以我们看到VRWorks 开发包中,还基于成熟的PhysX物理加速引擎,提供了对VR场景内的触觉交互,比如通过手柄传达给用户的震动、偏移、阻尼等等(如HTC Vive的手柄)。譬如在VR切气球,轻轻的触碰气球会有真实的气球回弹的感觉。

又一个让人感觉有些吐槽的设计,供电接口没有直接做在PCB,而是用“飞线”的方式连接到尾部导风槽。顿时让人感觉有些“Low”!不知道非公版的GTX 1060会不会延续这一“奇葩”设计。

又一个让人感觉有些吐槽的设计,供电接口没有直接做在PCB,而是用“飞线”的方式连接到尾部导风槽。顿时让人感觉有些“Low”!不知道非公版的GTX 1060会不会延续这一“奇葩”设计。

GP106-400核心芯片

GP106-400核心芯片

6片三星GDDR5 1GB显存颗粒

6片三星GDDR5 1GB显存颗粒

性能测试,小胜GTX 980

枯燥的数据总是让人觉得无趣,而玩家们关心的莫过于在1999元公版指导价的基础之下,GTX 1060到底能带给我们多少的惊喜,或者失望?为此,我们特别找来了公版GTX 1070、公版GTX 980以及非公版GTX 970,让它们在同一平台下竞技,是骡子,还是马?很快就能见分晓。需要说明的是,由于GTX 970没有公版产品,各厂商的产品基本都在NVIDIA的指导规格之上有所超越,我们特地找了一张相对接近NVIDIA GTX 970参考标准的非公版显卡,但其性能仍然高于公版规格,因此在性能上相比GTX 980相差并不算大。而对于GTX 960,虽然理论上它是GTX 1060上一代的对位显卡,但考虑到GTX 1060的实际性能,我们认为加入GTX 960的性能比较其实没有太大意义。

理论性能测试

从3DMark FireStrike Extreme(2.5K)、FireStrike Ultra(4K)以及3DMark-Time Spy(DirectX 12)的测试成绩来看,GTX 1060的表现的确可圈可点。其整体性能相比GTX 970领先幅度约15%~20%,但相比GTX 980而言,则在FireStrike Ultra和Extreme模式下都略处于下风。GTX 1060在Time Spy的DX12测试中与GTX 980基本打个平手,成绩相差不超过1%。不过在基于DX11的FireStrike测试中,GTX 1060相比GTX 980却有着大约3%~5%的差距,略略逊色于后者。

3DMark 测试

3DMark 测试

Time Spy DX12测试

Time Spy DX12测试

游戏测试

不同于3DMark FireStrike中的胶着状态,整体来看GTX 1060在DirectX 11游戏中表现出了领先GTX 970 10%以上的性能,相比GTX 1070,它又落后大约30%左右。不过在与GTX 980的对比上,有趣的是二者的差距在两个游戏的测试中各有千秋。在《古墓丽影9》的测试中,GTX 1060领先GTX 980约5%,而在《神偷4》的游戏测试中,反而是GTX 980略略占优,4K模式下领先GTX 1060约4%,而1080p模式下二者基本打个平手。

在两个DirectX 12游戏的测试中,GTX 1060再次表现出了强劲的势头,不但成绩远超GTX 970 30%以上,而且对GTX 980来说,它也展现出了不小的优势,领先幅度将近5%~20%不等。不过相比GTX 1070而言,GTX 1060仍然只能达到约70%~75%的性能,与理论测试基本相符。

《神偷4》 DX11测试

《神偷4》 DX11测试

《古墓丽影9》DX11 测试

《古墓丽影9》DX11 测试

《古墓丽影:崛起》DX12测试

《古墓丽影:崛起》DX12测试

《奇点灰烬》DX12测试

《奇点灰烬》DX12测试

GTX 1060,值得购买

坦白讲,在NVIDIA初宣称GTX 1060性能超过GTX 980,且公布的价格甚至不会比GTX 970高时,我们对此还是持有一定的怀疑态度的。毕竟对GTX 980来说,作为NVIDIA上一代的桌面显卡次旗舰产品,应该不会被下一代的甜点产品轻易击败吧?不过事实胜于雄辩,GTX 980除了在3DMark理论性能测试中领先于GTX 1060之外,在游戏的测试中都没有表现出明显强于GTX 1060的性能,二者各有千秋。从这一点而言,NVIDIA并未在GTX 1060的宣传上夸大其词。尤其是在DirectX 12模式下,GTX 1060在测试中几乎都领先于GTX 980。这一方面说明了Pascal架构相比Maxwell的确在DirectX 12的优化上下了狠功夫,之前NVIDIA被一直诟病的“DirectX 11是英雄,DirectX 12变成虫”的现象已经不复存在,更没有出现Maxwell显卡上常见的DirectX 12“负优化”的情况。另一方面,也证明了全新的16nm工艺为GPU性能与执行效率的提升做出了巨大贡献,架构与工艺的革新双管齐下,GTX 1060表现出如此抢眼的性能也就在情理之中了。如果GTX 1060在实际售价上不比NVIDIA 1999元的官方起步指导价高很多,而且货源充足的话,无疑它有潜力成为甜点级显卡市场上的一名巨星。GTX 970、GTX 980,真的可以彻底退休了。需要提醒的是,别忘了,GTX 1060可是定位于GTX 960的替代者,而现在它的性能已经足足超越了GTX 980,NVIDIA这次推出的甜点产品的确可以用“良心”二字来形容。或许也是因为GTX 960被玩家吐槽太多次“规格过低”而迫使NVIDIA做出的改变吧!

当然,肯定有玩家会想到,这次GTX 1060的推出,毫无疑问是剑指AMD的RX 480,二者无论是规格还是价格上,都是“针锋相对”。RX 480先于GTX 1060推出,尽管曾被吐槽“偷电”,但在推出之后叫好声还是远远多于谩骂声,市场反响非常优秀。或许正是迫于RX 480带来的压力,NVIDIA才决定将GTX 1060定位在RX 480竞争者的角色上,并保持着与后者几乎完全一样的市场价格区间。从本期的测试中,我们在性能上看出了GTX 1060相比GTX 970、GTX 980等上一代显卡在价格与性能上的优势,那么GTX 1060相比RX 480来说,在同级的竞争上是否有足够的优势呢?而且AMD在看到GTX 1060推出市场之后,是否会再次对RX 480的价格进行调整呢?也许在近期,就能见分晓!而《微型计算机》评测室也将在下一期的文章中,为您带来甜点对甜点的大碰撞,GTX 1060 Vs. RX 480,到底谁能够领先一步,不仅仅是性能,而是全方位的对碰!敬请期待。

分享到:

用户评论

共有评论(2)

  • 2017.02.27 20:36
    2楼

    然而对于我们穷人来说,1060就够了

    (0) (0) 回复
  • 2016.08.12 16:42
    1楼

    然而,老黄这是狠狠的干了480一把

    (0) (0) 回复

用户名:

密码: