LDA主题模型和推荐系统3

作者: Arya鑫 | 来源:发表于2017-08-03 12:12 被阅读191次

LDA 主题模型涉及到贝叶斯理论、Dirichlet 分布多项分布、图模型、变分推断EM 算法Gibbs 抽样等知识

这个图模型表示法也称作 “盘子表示法”(plate notation)。图中的双圆圈表示可观测变量(observed variable),单圆圈表示潜在变量(latent variable),箭头表示两变量间的条件依赖性(conditional dependency),把节点用方框(plate)圈起来,表示其中的节点有多种选择,重复次数在方框的右下角。

该模型有两个参数需要推断(infer):一个是 “文档 - 主题” 分布θ,另外是T个 “主题 - 单词” 分布ϕ。通过学习(learn)这两个参数,我们可以知道文档作者感兴趣的主题,以及每篇文档所涵盖的主题比例等。推断方法主要有 LDA 模型作者提出的变分 EM 算法,还有现在常用的 Gibbs 抽样法。


理解LDA,可以分为下述5个步骤:

一个函数:gamma函数

四个分布:二项分布、多项分布、beta分布、Dirichlet分布

一个概念和一个理念:共轭先验和贝叶斯框架

两个模型:pLSA、LDA(在本文第4 部分阐述)

一个采样:Gibbs采样


在LDA中,一篇文档是这样生成的:


LDA

pLSA是频率派的思想,那么LDA就是贝叶斯派的思想。它认为主题分布和词分布也是不确定了,为了得到他们,需要用他们的先验分布(Dirichlet)来进行估计。所以,LDA的过程是这样的:


来源:https://cosx.org/2010/10/lda_topic_model

           http://www.360doc.com/content/16/0428/10/478627_554452907.shtml

http://blog.jqian.net/post/lda.html(赞)

http://blog.csdn.net/claire7/article/details/46780849

http://blog.csdn.net/pipisorry/article/details/42649657


相关文章

  • LDA主题模型和推荐系统3

    LDA 主题模型涉及到贝叶斯理论、Dirichlet 分布、多项分布、图模型、变分推断、EM 算法、Gibbs 抽...

  • LDA主题模型和推荐系统1

    1. 推荐系统的意义 互联网大爆炸时期的信息过载的解决方案: 对用户而言:找到好玩的东西,帮助决策,发现新鲜事物。...

  • 10 主题模型 - 代码案例一 - LDA主题模型初识

    08 主题模型 - LDA09 主题模型 - LDA参数学习-Gibbs采样 安装 lda 库使用第三方的lda库...

  • 词典构造方法之LDA主题模型

    词典构造方法之LDA主题模型 主题模型LDA原理理解 LDA是一种非监督学习技术,可以用来识别大规模文档集(doc...

  • LDA主题模型

    LDA数学八卦学习笔记 数学知识 Gamma函数 Gamma函数的性质其可以看作阶乘在实数集上的扩展 Gamma分...

  • LDA主题模型

    JGibbLDA是Java版本的LDA算法,可以通过命令行的方式使用,也可以通过通过调用LDACmdOption中...

  • LDA主题模型

    待整理 假设文档是由n个词组成的,且不考虑词之间的关系,假设我们的词典有V个词语,v1,v2,...vv,那么最简...

  • LDA主题模型

    一、几个基础概念 1、贝叶斯理论:先验分布+数据(似然)=后验分布2、二项分布、Beta分布与共轭分布先验分布和后...

  • 主题模型LDA

    作用:对文档抽取主题概率分布思想:人类生成文章的过程如下:比如假设事先给定了这几个主题:Arts、Budgets、...

  • 12 主题模型 - 代码案例三 - scikit-learn中的

    11 主题模型 - 代码案例二 - scikit-learn中的LDA模型13 主题模型 - 代码案例四 - sc...

网友评论

    本文标题:LDA主题模型和推荐系统3

    本文链接:https://www.haomeiwen.com/subject/kjxplxtx.html