GPU优化

作者: 陈成_Adam | 来源:发表于2023-06-16 22:06 被阅读0次

通过阅读本文,你将知道:

  1. 什么是GPU优化

  2. 优化GPU的思路是怎样的

  3. 常见的优化GPU的方法有哪些

介绍

在做GPU优化之前,我们需要知道:

  1. 定位到瓶颈是前提。优化非瓶颈阶段,相当于做无用功

  2. 瓶颈总是存在的,而且通常是动态变化的。在GPU上运行某应用程序,总有一个阶段是瓶颈,而且随着运行不同的应用程序,瓶颈也是动态变化的

  3. 尽量不要过度优化。只需要优化到当前阶段不是瓶颈了即可

  4. 如果我们说应用程序处理阶段是瓶颈,代表着在一帧的渲染过程中,它大部分时间都是是整个流水线中最慢的阶段。

  5. 如果瓶颈已经不能再优化了,那么可以让其他阶段做更多的事情。类似于单位时间内可以渲染的帧的数量已经无法提升,那么可以提高每一帧的渲染质量。

瓶颈定位

瓶颈定位的思路,

  1. 为待测阶段设计若干测试用例,各测试用例在该阶段的工作量递减,其他阶段的工作量保持不变。如果帧率提升,那么该阶段很有可能就是瓶颈。

  2. 为待测阶段设计若干测试用例,各测试用例在该阶段的工作量不变,其他阶段的工作量递减。如果帧率保持不变,那么该阶段很有可能就是瓶颈。

GPU流水线可以大致划分为四个阶段,分别为:应用程序处理阶段、几何处理阶段、光栅化阶段和像素处理阶段。接下来,我们详细介绍每个阶段的可用的瓶颈定位方法。

应用程序处理阶段

  • 直接查看CPU的使用率

    • 如果CPU使用率维持在100%或者接近100%,则可以简单地认为应用程序处理阶段是瓶颈。

    • 这种方式有的时候不靠谱,因为有可能CPU是在等待GPU完成一帧的渲染。

  • 架空GPU的情况下查看CPU的使用率

    • 架空GPU方式可以用一个空的驱动程序。

    • 这种方式的缺点是:检测不到驱动程序的处理导致的瓶颈问题以及CPU和GPU交互导致的瓶颈问题。

  • 让CPU降频或超频运行

    • 如果降频导致性能相应地等比例降低,那可以认为应用程序处理阶段是瓶颈。超频是类似的。

几何处理阶段

  • 增加顶点属性

    • 增加顶点属性(如纹理坐标)相当于增加了顶点抓取的数据量,如果增加后GPU性能下降则可以认为顶点抓取便是瓶颈。
  • 增加染色程序的大小

    • 增加染色程序的长度之后,如果GPU性能下降则可以认为顶点处理是瓶颈。

    • 需要注意,要避免编译器优化掉添加的无效指令。

光栅化阶段

  • Shadow Map Generation这个功能使用的像素染色程序非常简单,使用这个功能的时候,光栅化和像素合并阶段都有可能成为瓶颈。

  • 在渲染小三角形比较多的场景时(如草地或树叶),光栅化可能会成为瓶颈。验证方法是:增加染色程序的大小。如果渲染一帧的时间没有增加,那么光栅化阶段便是瓶颈。

像素处理阶段

  • 降低屏幕分辨率

    • 如果把屏幕分辨率降低可以显著提升帧率,那么很有可能像素处理阶段便是瓶颈。
  • 增加片段染色程序的大小

    • 增加染色程序的长度之后,如果GPU性能下降则可以认为像素处理是瓶颈。

    • 需要注意,要避免编译器优化掉添加的无效指令。

  • 简化片段染色程序

    • 简化片段染色程序之后,如果一帧的渲染时间下降明显则可以认为像素处理是瓶颈。
  • 降低纹理大小

  • 修改缓冲区的位深度

  • 打开关闭混合

  • 改变混合模式

  • 渲染头发、草地、树叶等(像素染色程序简单

优化瓶颈

对于应用程序处理阶段,

  • 提高代码运行效率

  • 提高存储访问效率

  • 减少存储访问

对于几何处理阶段,

  • 优化染色程序,尤其是光照相关

  • 顶点预加载

  • 顶点数据压缩

对于光栅化阶段,

  • Early Z

  • 开启背面消隐

对于像素处理阶段,

  • Early Z

  • 开启背面消隐

  • 数据压缩

  • 像素和深度缓冲区合并

  • Forward Pixel Killing

  • Transaction Elimination

总结

  • GPU优化是找到GPU的瓶颈阶段并使得该阶段不再是瓶颈的过程,以及让非瓶颈阶段做更多有意义的事情的过程。

  • 瓶颈定位的思路:

    • 为待测阶段设计若干测试用例,各测试用例在该阶段的工作量递减,其他阶段的工作量保持不变。如果帧率提升,那么该阶段很有可能就是瓶颈。

    • 为待测阶段设计若干测试用例,各测试用例在该阶段的工作量不变,其他阶段的工作量递减。如果帧率保持不变,那么该阶段很有可能就是瓶颈。

  • 简单介绍了应用程序处理阶段、几何处理阶段、光栅化阶段和像素处理阶段的常见瓶颈定位和优化方法。

相关文章

  • iOS底层原理之性能优化

    文章目录 CPU和GPU 卡顿优化 - CPU 卡顿优化 - GPU 离屏渲染 耗电 耗电优化 APP的启动 AP...

  • 性能优化02-布局优化

    性能优化02-布局优化 一、CPU与GPU 1、定义 为什么要了解CPU与GPU呢?因为布局绘制就是CPU与GPU...

  • iOS底层原理--性能优化

    文章目录CPU和GPU 卡顿优化 - CPU 卡顿优化 - GPU 离屏渲染 耗电耗电优化 APP的启动 APP启...

  • iOS底层原理之性能优化

    文章目录CPU和GPU 卡顿优化 - CPU 卡顿优化 - GPU 离屏渲染 耗电耗电优化 APP的启动 APP启...

  • 21-性能优化

    一、CPU和GPU 二、卡顿产生的原因和优化 卡顿优化-CPU 卡顿优化-GPU 卡顿监测 监控卡顿的demo:推...

  • 卡顿优化

    卡顿优化 - CPU 卡顿优化 - GPU 离屏渲染 卡顿检测 耗电优化

  • GPU优化

    不用的图片销毁,销毁,销毁,Laya.loader.clearTextureRes("res/atlas/res/...

  • 对于手游的优化

    给手游做优化,无非就CPU性能优化、内存性能优化、资源优化、GPU优化、IO优化、网络优化、耗电优化这些,为此汇总...

  • 性能优化

    面试题 CPU和GPU 屏幕成像原理 卡顿产生的原因 卡顿优化 - CPU 卡顿优化 - GPU 离屏渲染 卡顿检...

  • 使用GPU Instancing屏幕花屏问题

    1)使用GPU Instancing屏幕花屏问题2)如何优化AssetBundle大小3)如何使用GPU Skin...

网友评论

      本文标题:GPU优化

      本文链接:https://www.haomeiwen.com/subject/lrxdydtx.html