英伟达发布新显卡是什么?

2020-07-19 科技 87阅读

在2018年德国科隆游戏展(Gamescom 2018)上,英伟达发布了3款基于全新图灵架构的GeForce RTX 20系列显卡——RTX 2080 Ti、RTX 2080、RTX 2070。发布会上英伟达CEO黄仁勋表示:“这是一种新的计算模式。图灵处理器像只怪物,令人难以置信。”他还演示了现有显卡和RTX系列的全新渲染技术。

德国科隆游戏展上发布的三款GeForce RTX GPU,RTX 2080 Ti属于旗舰产品,主频为1350MHz,配备了4352 CUDA内核以及11GB GDDR6显存。RTX 2080是高端产品,主频为1515MHz,内置2944 CUDA内核和8GB GDDR6显存。英伟达还表示RTX 2080专为超频而设计,旨在接替热门的GTX 1080。RTX 2070比较亲民,主频为1410MHz,配备2304 CUDA内核和8GB GDDR6显存。

英伟达承诺“GeForce RTX 20的性能将比上一代显卡的高6倍”,并实现实时光线追踪技术((Ray-Tracing))。新RTX 20系列的性能和光线跟踪支持完全归功于上周英伟达在SIGGRAPH 2018发布的新一代GPU架构——Turing(图灵),雷锋网(公众号:雷锋网)在《英伟达放出12年来最大招:全新图灵架构登场,全球首批即时光线追踪GPU同步亮相》进行了详细的介绍。黄仁勋称图灵架构是自2006年CUDA GPU发明以来最大的飞跃,也是英伟达十多年来在计算机图形领域最重要的创新。

基于最新的图灵架构,图灵大核心(TU102)集成了186亿个晶体管,核心面积达754平方毫米,相比Pascal帕斯卡架构核心分别增加了60%、58%,是有史以来第二大的芯片,它的内部有三种不同核心:一是传统的SIM CUDA核心阵列,浮点计算性能最大14TFlops,整数计算最大性能14TIPS,并支持浮点、整数并行执行,可变速率着色(Variable Rate Shading)。二是光线追踪专用核心RT Core,每秒钟可计算最多100亿条光线(10 Giga Rays/sec),三是深度计算辅助核心Tensor Core,FP16浮点性能110TFlops,INT8整数性能220TOPS,INT4整数性能440TOPS。

光线追踪技术过去只在影视作品的CG制作中出现,一般是用几天时间,渲染出几帧动画,光线追踪也一直被认为是电子游戏的“圣杯”。今年三月,英伟达发布 RTX光线追踪技术,这项新技术能够计算光线反射、折射、散射等路线,渲染出逼真的画面,可为游戏开发者提供电影级画质的实时渲染,也就是让游戏看起来更像电影。据悉,这些新GPU依靠自身的一个特殊部分来快速呈现高分辨率图形,完成图像的大部分成像工作后,使用人工智能技术来猜测未完成的像素。

发布会上的光线追踪演示让人印象深刻,但大多数仅限于物理模型材料,室内反射和照明。不过更重要的是对游戏的支持,英伟达承诺在《古墓丽影:暗影》中进行实时光线追踪,演示中夜间场景中显示了逼真的阴影显示并在《战地风云》和《地铁出埃及记》中提升照明和其他效果。

英伟达还承诺,未来会有更多的游戏将获得光线追踪支持,英伟达简要透露了21款游戏即将获得RTX支持,包括杀手2:沉默刺客,少数幸运儿,绝地求生和最终幻想15,但英伟达仍然需要不断推动游戏开发者采用这项新技术。另外,由于英伟达在Windows 10中采用了新的DirectX光线跟踪(DXR)API来补充英伟达的RTX工作,英伟达还将与微软合作推动光线跟踪。Epic Games还将在今年晚些时候为虚幻引擎开发人员提供实时光线跟踪。

GeForce RTX 20系列性能的提升以及实现光线追踪最重要的就是英伟达超过一万个工程师的努力成果——图灵架构,该架构承载了RT核心(RT Core)以及全新张量核心(Tensor Core)。RT核心专门用于实时光线追踪的处理器,能对光线和声音在3D环境中的传播进行加速计算,据称它的实时光线追踪能力提升到了Pascal架构的25倍。张量核心是为深度学习训练和推断加速的处理器,支持每秒500万亿次张量运算。

在RTX中,图灵架构将光线跟踪与传统光栅化相结合以充分利用两种技术的优势,英伟达表示,最快的GeForce RTX部件每秒可以投射10亿(千兆)射线,与未加速的Pascal相比,射线追踪性能提高了25倍。图灵结构也承载了Volta的张量核心,甚至比Volta还要强大。除了加速光线追踪本身之外,英伟达在其图灵开发工具包中的其他工具是通过使用AI去噪来减少场景中所需的光线量,这是张量核心所擅长的。

不过,即便英伟达称基于图灵架构的RTX显卡性能比Pascal架构的GTX显卡提升了6倍,但该公司正在尝试重新定义性能比较,这些比较仅限于新卡的性能。 英伟达甚至没有列出每秒传统的浮点运算(称为teraflops)。新卡对比了RTX-OPS,这是GPU在阴影、光线跟踪等操作中的平均性能,以及每秒千兆光线的测量结果,它可以测量新GPU的光线跟踪效果。

声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com