亚博真人安全有保障-亚博提款速度快

0728-539492663

在线客服| 微信关注
当前位置: 首页 > 企业新闻

亚博真人安全有保障-NVIDIATuring架构解析:追光逐影,成败未定


本文摘要:的双曲馀弦值。

的双曲馀弦值。的双曲馀弦值。正如以前所说,NVIDIA希望通过混合图形推进消费级GPU转世的变化。NVIDIA进入这一步的背景原因除了动态光跟踪是计算机图形学的圣杯之外,还有很多打破图形纯主义的潜在动机。

光跟踪第一课:whatwhy是NVIDIA作为光跟踪使用的RThore是Turing结构的两个技术基础之一,在理解Turing结构之前,最差的讨论是光跟踪,NVIDIA为什么不投入这么多芯片资源。简而言之,光跟踪是一种图形方式,可以模拟光在现实世界的表现(光、反射等)。构建仅次于问题,就像无底洞一样滑稽性能的市场需求,用最完整的方法计算场景中每个光源收到的所有光线,就不会在场景中追踪无限光线。

多年来,算法工程师们为光线追踪开发了许多优化措施,其中最重要的是反转光线这一非常简单的概念,不是从光源追踪光线,而是从画面、观测者的视点反向追踪光线,然后实际到达画面的光线但是,即使用于包括该方法在内的很多优化方法,光跟踪对性能的市场需求仍然很低。除了最基本、最硬的光线追踪外,其他任何情况都远远超过了动态图形的范围。

这些优化技术意味着在计算机上完成了合理的时间,当然这个合理是由时间和天天决定的,这需要不同场景的复杂性和想要超越的图形效果。实质上到目前为止,光线追踪仍然主要是3D动画电影等离线场景。格栅化图形意味着非格栅追踪的高成本不能作为动态图像图形使用,因此计算机行业从一开始就用于格栅简化的图形方法。名字上有光字,但在整个光栅化图形中明显没有光的概念。

光栅化(Rasterization)是指将3D几何学转换为2D像素的过程,所有的画面效果都只针对像素的操作者。游戏开始图形画面时,首先从CPU分解游戏场景中所有物体的顶点,将所有顶点的座标信息发送给GPU内的几何机组。

几何机组以屏幕的方向为基准构筑可用空间,将这些顶点按照座标移动到空间,然后将顶点连接到线框上,构筑物体的轮廓,在表面复盖面积上层带有光信息的基础纹理作为复盖。到了这一步,我们的游戏画面第一次有几何形态。

接下来是整个电网化图形流程的核心:电网化、GPU内的电网化单元(Rasterizer)根据线投影关系,将整个可用空间从三维立体形态按压成二维平面。之后,流处理器根据场景中物体之间的几何方向关系,通过各种图形算法,确认哪些像素是黑暗的,哪些像素是黑暗的,哪些像素是低光的,哪些像素是阴影的。在流处理器忙于计算像素信息的同时,GPU内的纹理单元也开始将预设的整张纹理材质切割成画面所需的形状。

最后,流处理器和纹理单元分别将计算的像素信息和裁剪的纹理材质提交给处于GPU后端的ROPs,ROPs将两者混合填充到最后的画面并输入。此外,游戏中雾化、景深、动态模糊、锯齿等后处理效果也由ROPs完成。

看到这里,我们看到的所有游戏画面都是GPU画的3D立体画。3D立体画看起来真的不现实,各不相同的画家水平如何,格栅化图形的画面真的不现实,各不相同的图形算法是否先进设备和完善。

混合图形,光线跟踪回到格栅简化的非常简单和缓慢,要求对现实世界画面的模拟受到限制,格栅化普遍存在光、光、影不自然等缺陷。如果格栅化这么不准确,游戏如何进一步提高其图像质量?当然,以后可以这样回顾,光栅化解决问题并不是不可能的,只是必要的计算性能不会高速收缩。就像马利亚的谎言用十个谎言圆一样,有时想用格栅化的图形分解细致的画面,比追踪光的自然过程更简单。换句话说,与其在光栅化这种本质上,不如在视觉上愚弄的图形方式上消耗这么多性能,不如将这些希望投入到另一个能够正确地图形虚拟世界的技术上?2018年,整个计算机行业都在思考这个问题。

对NVIDIA来说,前进的道路还是纯粹的格栅化,混合图形:将格栅简化与光的跟踪结合起来,其想法是在有意义的地方用于光的跟踪——作为照明、影子和其他与光有关的相互作用的内容,用于传统的格栅化处理其他一切这意味着开发人员可以互相美丽,根据市场需求平衡格栅简化的高性能和格栅追踪的高品质,需要立即从格栅化函数调用到格栅追踪,失去前者的所有性能优势。到目前为止,NVIDIA及其合作伙伴展示的案例更容易构。例如,正确的动态光和更好的全球光,混合图形可以扩展到任何与光有关的操作者。

但NVIDIA、微软等公司也被迫从零开始建立生态系统,不仅要向开发人员推广光跟踪的优势,还要教开发人员如何有效建立。然而,我们仍然可以讨论光跟踪,考虑NVIDIA如何通过构建专用硬件单元来实现动态光跟踪。界面体积层次结构可以说,NVIDIA在Turing上下了相当大的赌局,传统的GPU架构可以高速处理格栅化图形,但不擅长追踪光线。

因此,NVIDIA必须为光跟踪设置专用硬件单元,但这些额外的晶体管和电力消耗对传统的光栅化图形没有必要的帮助。该部分专用硬件单元作为解决问题的光跟踪的最基本问题,大大判断光与物的共线状况。该问题最少见的解决方案是将三角形保存在非常适合光跟踪的数据结构中,该数据结构称为BVH(边界体积层次结构)。从概念上讲,BVH非常简单,不是检查各个多边形,而是检查场景的一部分是否与光共线。

如果场景的某个部分与光线共通,则将其细分为小部分,再次检查,顺序继续后单个多边形,此时光线检查解决问题。对于计算机科学家来说,这听起来很像二元搜索的应用,很明显。每次检查都允许放弃大量选项(在光的跟踪中是多边形)作为可能的答案,然后在短时间内可以到达正确的多边形。

BVH反而本质上保存在树根数据结构中,每次细分(边界板)都保存在父亲边界框的子节点上。现在BVH的问题是,尽管完全增加了必须识别的光的共线量,但这些目的是分开光,每个像素必须通过多个光时,每个光都必须进行大量的检查,其计算量还不低。这也是为什么专门用于光跟踪单元加速硬件的最重要原因。

继承Volta精神的Turing结构,考虑到这次这次Turing体系结构,新的TuringSM看起来与上一代PascaltSM不同,但理解Volta体系结构的人同意Turing体系结构与Volta体系结构相似与Volta一样,TuringSM分为4个子核(或处理块),每个子核具有单个warp调度器和调度单元,而Pascal的两个分区设置是每个子核的warp调度器具有两个比较的调度端口。从广义上讲,这样的变化意味着Volta和Turing在一个表周期内失去了从线程接受第二个不依赖命令的能力。

Turing可能与Volta在两个周期内继续执行命令完全相同,但由于调度程序可以在每个周期接受独立的国家命令,Turing最后可以通过这种方式确保双向命令级别的阶段(ILP),同时也有比Pascal的2倍的调度程序正如我们在Volta看到的,这些变化与新的调度/持续执行模式密切相关,Turing也有独立国家的线程调度模式。与Pascal不同的是,Volta和Turing有各行程的调度资源,有程序计数器和各行程的堆栈来跟踪行程的状态,以及分发优化器智能地将活动的warp行程组成SIMT单元。

关于CUDA和ALU(算术逻辑单元),Turing子核有16个INT32单元、16个FP32单元和2个Tensor单元,与Volta子核的设定完全相同。用于Volta这样的合并INT/FP数据路径模型,Turing可以同时执行FP和INT指令,与RTCore密切相关。Turing和Volta的区别在于Turing没有FP64单元,FP64的吞吐量只有FP32的1/32。这些细节可能偏向于技术,但Volta的设计可能是为了最大限度地提高Tensor和Core的性能,最大限度地增加了破坏性的并行性和与其他计算的工作阻抗的协议。

Turing的第二代Tensore和RT师Core也是如此,其中4个独立国家调度的子核和粒度线程处理在混合游戏指南的阻抗下构筑最低性能非常简单。在内存方面,Turing的每个子核都有类似Volta的L0指令内存,具有完全相同大小的64kb寄存器文件。在Volta中,增加TensorCore的延迟是最重要的,Turing可能在某种程度上不利于RTCore。

亚博提款速度快

TuringSM每个子核也有4个读取/存储单元,高于Volta中的8个,但仍保持4个纹理单元。新的L1数据缓存和共享内存(SMEM)进一步向下扩展,改良并统一为单个可分区内存块,是Volta的另一个想法。

对于Turing来说,这看起来是一个人群的96KBL1/SMEM,传统的图形工作阻抗分为64KB专用图形着色器RAM和32KB纹理高速缓存和寄存器文件阻塞区。同时,计算工作阻抗,L1/SMEM区分最少64KB为L1,其馀32KB为SMEM,相反(Volta的SMEM最少96KB)。RTCore:混合图形和动态光追踪在Turing上,光追踪几乎不能代替传统的光栅化图形,而是作为混合图形的一部分不存在,动态也不能在每个像素只有少量的光和大量的减震相结合的情况下构筑。由于性能原因,现阶段开发商将有意识和针对性地利用光线跟踪来构建格栅化无法构建的部分细致效果,如全局照明、环境光屏蔽、阴影、光线和反射等。

光跟踪在一定程度上也可以局限于场景中的特定对象,用于光栅简化和z缓冲器替换主光感应,只对次光进行光跟踪。根据光跟踪在计算机图形领域的重要性,NVIDIA,Research在一段时间内仍在研究各种BVH建设,探索光跟踪加快的结构问题。但是,NVIDIA没有泄露RTCore和BVH构筑的细节。

RTCore与Tensore不同,Tensore与FP和INT核心一起看起来更像FMA阵列,RTCore更像典型的维修IP块。与子核中的纹理单元非常相似,RTCore的命令被路由到子核外,从SM接管到光探测器后,RT核心自律地反复BVH,继续进行光共线检测。

这种类型的反复和交叉相同函数光跟踪加速器是众所周知的概念,多年来已经构筑了很多。反复和交叉检查是计算密度最低的两项任务。相比之下,在着色器中反复BVH,每个光线都需要数千个指令槽,这些都用于检测BVH中的边界板的交叉点。RTCore还处理了一些内存操作者的组和调度,以最大限度地提高跨越多个光的内存吞吐量。

与许多其他工作阻抗一样,内存比特率是光跟踪的罕见瓶颈,也是NVIDIA回答Research多篇论文讨论的焦点。考虑到光跟踪不会产生非常点状和随机的内存采访,SIP块可能有内存和光缓冲区。TensorCores:将深度自学推理小说作为游戏图形使用TensorCores是Volta的典型特征,但这部番Turing配备的第二代TensorCore毕竟是蓝色的。第二代Tensorcore的主要变化是减少了作为推理小说使用的INT8和INT4精度模型,通过新的硬件数据路径完成,继续积累积分的面积有INT32乘积。

INT8模型的计算速度是FP16的2倍,或者每钟2048次整数计算的INT4模型的计算速度是FP16速度的4倍,或者每钟4096次整数计算。第二代Tensore依然具备。

FP16模型需要反对FP16模型,没有FP32累加器。虽然CUDA10还没有出来,但加强的WMMA操作者需要说明其他差异。例如,操作数量的追加可以拒绝接受矩阵的大小。GeForceRTX和Turing不仅的不仅仅是RTX这个新品牌的命名,Turing的所有功能都不是一体化的NVIDIARTX平台也包括NVIDIATX平台:包括所有Turing功能的标准化平台,还包括高级着色器NVIDIARTX光跟踪技术:RTX平台下光跟踪技术的名称GameWorksRacing:光跟踪模块的GameWorcing:光跟踪技术DLSS用于为游戏设置的DNN(深度神经网络),用于超高品质的64倍的超级抽样图像和现实画面的训练,通过Tensor裁剪Core推测高品质的锯齿结果。

在标准模式下,DLSS通过低输出样本推测出高倍抗锯齿的结果,在目标分辨率上可以超过类似TAA的效果。由于涉及深度自学,NVIDIA正在将纯计算/专业功能推向消费者领域。在Turing上,Tensore可以加快DLSS等特性,也可以加快基于AI的减震器,清洁和校正动态光追踪图形的画面。

总结了Turing架构和GeforceRTX的发表,显示了计算机图形学在消费级市场开始从欺诈的视觉愚蠢向现实的追光弃影发展。迄今为止,业界对它们的赞扬也不吝惜。Turing结构设置了专用的光跟踪单元RTCore,与Tensor和Core相结合展开了AI减震,但在耐心客观的思考下,根据(公共编号:)的理解,在1080P分辨率下,光跟踪没有基本可用性的入门阈值是每帧画面包括1亿光,以60fps为基准回顾一下刚刚发表的GeforceRTX-2080Ti/2080/2070三种显示卡,其光跟踪性能分别每秒处理100亿/80亿/60亿的光,NVIDIA可能对未来更低的Geforce反应RTX/GTX2060等显示卡知道这是不是巧合,GeforcercerrtX-2070的光跟踪性能正好被压在上述没有基本可用性的入门阈值上,更低端的显示卡不反对光跟踪也是可能的。

另外,现在的光跟踪算法可能过于执着地修正,光影关系的恢复成果可能会出现错误。例如,NVIDIA在战地V这个游戏中展示RTX效果时,汽车在火光之后经常出现错误,红框的灯罩背对着车后的火光,从角度来看几乎不应该有火光:而且从最近流入的性能测试来看,最低端的GeforceRTX前2080Ti在打开光线跟踪之后,只能在1080P下保持框架数量在45fps左右,似乎比理论性能大幅度提高。

各种情况指出,现阶段的光追踪仍然在可用性的门槛边缘游泳,Turing和GeforcercerTX显示卡是否已经通过了这个脚,知道还没有说……via:Anandtech版权文章允许禁止发表。下一篇文章发表了注意事项。


本文关键词:亚博真人安全有保障,亚博提款速度快

本文来源:亚博真人安全有保障-www.dnfpinguo.com

客户案例Customer case
  • 江西科技学院2017年艺术类考生成绩查询系统 入口:http://zsb.jxut.edu.cn/art.php:亚博真人安全有保障
  • 亚博提款速度快-湖南工业大学2017年艺术术科考试成绩查询系统 入口:http://zsb.hut.edu.cn/ysks.asp
  • 微盟智慧零售掀起家装数字化变革  助力齐家网领跑家装智慧零售赛道
  • 亚博提款速度快|2017年辽宁大学录取信息查询系统 入口:http://zsxt.lnu.edu.cn/zsb/cxzx/ptgklog
  • 2016年武汉大学高考录取分数线【亚博提款速度快】
  • 亚博提款速度快|2019年梅县区实验幼儿园秋季招生办法公吿
  • 中国(无锡)跨境电子商务综合试验区公共服务平台建成投用
  • 江苏省教育考试院:2016江苏高考录取查询入口
  • 源自中国香港室内设计师Kenny Wong之手的Molly:亚博提款速度快
  • 星光第二实验幼儿园“国家网络安全宣传周”系列活动