美文网首页玩转大数据大数据部落大数据
R语言用Rcpp加速Metropolis-Hastings抽样估

R语言用Rcpp加速Metropolis-Hastings抽样估

作者: 拓端tecdat | 来源:发表于2020-04-06 22:02 被阅读0次

    在最近的一篇文章中,我描述了一个Metropolis-in-Gibbs采样器,用于估计贝叶斯逻辑回归模型的参数。

    这篇文章就此问题进行了研究,以展示Rcpp如何帮助克服这一瓶颈。TLDR:只需用C ++编写log-posterior而不是矢量化R函数,我们就可以大大减少运行时间。

    我模拟了与上一篇文章类似的模型中的数据:

    need-to-insert-img

    对于这个分析,我编写了两个Metropolis-Hastings(MH)采样器:sample_mh()和sample_mh_cpp()。前者使用对数后验编码作为向量化R函数。后者使用C ++(log_post.cpp)中的log-posterior编码,并使用Rcpp编译成R函数。Armadillo库对C ++中的矩阵和向量类很有用。

    因此,在每次迭代中,提出了系数向量。 下面用红线表示链,表示生成数据的参数值。

    need-to-insert-img

    似乎趋同。平均接受概率在采样运行中收敛到约20%。

    那么Rcpp实现与R实现相比如何呢?Rcpp的运行时间明显较低。当log-posterior被编码为矢量化R函数时,采样器相对于Rcpp实现运行速度大约慢7倍(样本大小为100)。下图显示了样本大小为100到5000的相对运行时间,增量为500。

    need-to-insert-img

    直观地说,C ++带来了一些效率增益。但很明显,Rcpp是解决代码瓶颈的好方法。

    相关文章

      网友评论

        本文标题:R语言用Rcpp加速Metropolis-Hastings抽样估

        本文链接:https://www.haomeiwen.com/subject/tniiphtx.html