RTX30显卡的线上发布会中有一个细节特别引人注目,那就是当一个名为TFLOPS的数据发布时,如果你看的视频有弹幕,就会立刻爆炸。这个参数到底是什么?为什么人们会如此关注?今天就来说说吧。TFLOPS是Tera和浮点运算拼cond。
RTX 30显卡的线上发布会中有一个细节特别引人注目,那就是当一个名为TFLOPS的数据发布时,如果你看的视频有弹幕,就会立刻爆炸。这个参数到底是什么?为什么人们会如此关注?今天就来说说吧。
TFLOPS是每秒万亿次和浮点运算的组合。后者的意思是每秒浮点运算,Tera的意思是万亿,合起来就是每秒多少万亿次浮点运算。因为当前图像是按像素处理的,每个像素的颜色都要浮点计算,然后组合成一张图片,所以这个参数表示显卡或GPU每秒能处理多少像素。
它的基础来自于现在的GPU设计,由很多小的处理核或者流处理器组成。这个核比处理器核简单很多,每个时钟周期只负责处理一个浮点数据,所以浮点运算的总数就是核心时钟周期数。现在核心一次可以处理1个文佳社会百科的双精度浮点数据,相当于2个文佳社会百科的基本单精度浮点数据,所以GPU的浮点运算次数可以通过2得到。
回去看看这个参数对游戏意味着什么。分辨率确定后,每张图片的像素数也就确定了。然后,每秒处理的像素越多,每秒实际处理的图片就越多。这是什么意思?当然游戏的帧率(每秒帧数)越高。没错。对于同代,尤其是同核的显卡,基本上可以通过计算其浮点运算能力来了解游戏速度。
但是这种比较对于不同代甚至不同架构的GPU来说并不合适。比如RTX 3080的浮点运算量是RTX 2080 Ti的两倍,帧率能达到RTX 2080 Ti的两倍吗?从之前的测试我们都知道,肯定不是这样。
这就涉及到另一个问题,就是核的效率问题,因为没有人能保证所有的核或者流处理器都能一直满负荷有效运行,它的实际发挥还得兼顾前端分配、后端合成、内存数据等单元的协调。因此,在设计不同的架构时,根据理想情况计算的浮点运算次数也是不同的。
RTX 30也不一样,因为它实际上让每个内核中的整数运算单元都参与浮点运算,导致“理论”运算能力翻倍。但由于非专业工作,整数单元的浮点运算效率赶不上专业浮点运算单元。另外,前端数据分发能力和内存带宽都没有翻倍,所以效率明显下降。最后我们可以看到,翻倍的浮点运算能力只带来了不到40%的实际帧。
以上就是由优质生活领域创作者 嘉文社百科网小编 整理编辑的,如果觉得有帮助欢迎收藏转发~
本文地址:https://www.jwshe.com/572449.html,转载请说明来源于:嘉文社百科网
声明:本站部分文章来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。分享目的仅供大家学习与参考,不代表本站立场。