美文网首页
关于pow的优化

关于pow的优化

作者: 恶毒的狗 | 来源:发表于2020-03-04 16:17 被阅读0次

球形高斯近似

之前提到,这篇文章 介绍了通过 球形高斯近似 来优化 pow 的计算,代码如下:

优化前:

// Generalized Power Function
float pow(float x, float n)
{
    return exp(log(x) * n);
}

优化后:

// Spherical Gaussian Power Function 
float pow(float x, float n)
{
    n = n * 1.4427f + 1.4427f; // 1.4427f --> 1/ln(2)
    return exp2(x * n - n);
}

推导

关于上面代码的推导,可以参考 这篇文章,这里再列一下主要推导过程:

pow球形高斯近似:

pow(nh, K) = exp(-K*(1-nh))

其中 exp 可以用 exp2 这样表示:

exp(a) = exp2(a/ln(2))

带入后得到:

pow(nh, K) = exp2(-(K/ln(2))(1-nh))

这里的 1 / ln(2) 是一个常量,约等于 1.4427f,我们可以提前计算好,再带入上面的公式:

pow(nh, K) = exp2(-(K*1.4427f)(1-nh)) = exp2(nh*K*1.4427f-K*1.4427f)

把 K*1.4427 提出来后可以得到:

float A = K * 1.4427
pow(nh, K) = exp2(A * nh - A)

用代码表示如下:

// Spherical Gaussian Power Function 
float pow(float x, float n)
{
    n = n * 1.4427f;
    return exp2(x * n - n);
}

这个结果和文章最开头的优化代码还是有区别的,主要原因是 pow(nh, K) = exp(-K(1-nh))* 这个近似对于 比较小的K 来说近似结果相差较大,作者做了一些对比,如下图:

image

针对这个问题,作者也介绍了一个更好的近似方式,即给原先的公式添加一个常数,如下:

pow(nh, K) = exp((K+X)(nh-1))

可以看到,这里的 X0 的时候就是之前的近似公式,作者建议 X[0,1] 这个区间取值。

X1 时,就是我们上面的优化代码:

// Spherical Gaussian Power Function 
float pow(float x, float n)
{
    n = n * 1.4427f + 1.4427f; // 1.4427f --> 1/ln(2)
    return exp2(x * n - n);
}

下图是添加常数后 pow(cos(x), 2) 的近似效果对比,红色曲线是近似曲线,可以看到,近似效果还不错:

image

游戏里的效果

优化前:

image

优化后:

image

地表的高光几乎看不出什么差别。

其他

作者的总结:

This post provided an application of a SG approximation, where the goal was to save a few ALU instructions. Again, for modern GPUs, this is not necessarily beneficial, but for older mainstream hardware, such as the PS3 and XBOX360 GPUs, it is a quite useful tool to have in your pocket.

意思是对于现代 GPU,这样做可能意义不大,不过对于老一点的硬件,这个优化值得拥有。

个人主页

本文的个人主页链接:https://baddogzz.github.io/2020/03/04/SGA-Pow-Opt/

好了,拜拜!

相关文章

  • 关于pow的优化

    球形高斯近似 之前提到,这篇文章 介绍了通过 球形高斯近似 来优化 pow 的计算,代码如下: 优化前: 优化后:...

  • RMQ

    优化可以存log2(N),pow(2,n)可以用<< 来实现

  • Bitcoin中的PoW共识机制代码解读

    PoW共识机制又双来了 之前已经讲了两篇关于PoW的内容,基本上把PoW介绍的很详细了(个人水平有限),那么我们是...

  • 关于PoW和PoS

    之前一直计划写一篇关于PoS和PoW对比的文章,一直由于各种(懒惰)原因迟迟没有落笔,今天看到社区里有人问到PoW...

  • 区块链共识算法总结

    关于区块链的共识机制的特点总结 首先给打家介绍POW: POW即工作量证明,是一种非常简单的方法。 优点:1.算法...

  • 对矿业的一点思考

    关于矿机 矿机是对PoW挖矿算法的ASIC化,通过专用的硬件芯片快速执行PoW算法(通常是哈希算法)。设计一个公链...

  • 全球区块链金融新时代,CelesOS测试网正式上线

    随着区块链技术的快速发展,区块链核心技术已经从1.0实现了2.0的跨越,POW,POS,DPOS等共识机制以及优化...

  • 关于pow编译后的代码

    关于pow编译后的代码 侑虎 的深度测试文档里,有一个关于地表shader的报告: 报告提到: 这里的 log2 ...

  • 深入浅出区块链教程——12.PoW共识

    PoW共识 PoW 工作量证明 因为比特币采用了 PoW 共识机制,所以这个概念才得以被广泛传播。PoW 全称 P...

  • 关于PoW和PoS(续 )

    社区里又继续了一些讨论,对我自己也有一些启发,还是值得一看,所以又转载到公众号,作为上一篇的续。 priewien...

网友评论

      本文标题:关于pow的优化

      本文链接:https://www.haomeiwen.com/subject/mycblhtx.html