LDA模型分析（二）：pLSA建模与求参

LDA模型分析（二）：pLSA建模与求参

作者: 林桉 | 来源:发表于2018-09-13 23:57 被阅读68次

LDA模型分析（二）：pLSA建模与求参
LDA模型分析（三）：LDA建模与求参
07 主题模型 - 知识补充 - 概率知识、二项\多项\Beta
LDA 与PLSA
LDA 和 LSI 聚类效果比较
LDA 与 LSA、PLSA、NMF相比
08 特征工程 - 特征降维 - LDA
10 主题模型 - 代码案例一 - LDA主题模型初识
Task4模型调参
LDA建模

pLSA建模与求参

pLSA
LSA(隐性语义分析)的目的是要从文本中发现隐含的语义维度-即“Topic”或者“Concept”。尽管基于SVD的LSA取得了一定的成功，但是其缺乏严谨的数理统计基础，而且SVD分解非常耗时。Hofmann在SIGIR'99上提出了基于概率统计的PLSA模型，并且用EM算法学习模型参数。PLSA的概率图模型如下

image.png

pLSA是一种词袋方法:

image.png
几个定义：

image.png
pLSA建模目标：根据文档反推其主题分布

image.png

图中被涂色的d、w表示可观测变量，未被涂色的z表示未知的隐变量，N表示一篇文档中总共N个单词，M表示M篇文档。
已知：

image.png
问题：
image.png
pLSA求参数：EM算法
基本思想是：

image.png
image.png

关键：找到𝐿(𝜃)的一个下界，然后maxmize这个下界，逼近求解的似然函数𝐿(𝜃)。

image.png
pLSA求参数：两未知参数矩阵化

image.png
pLSA求参数：两未知参数

image.png
pLSA求参数：E-step

image.png

假定参数已知，计算此时引变量的后验概率。
pLSA求参数：M-step

image.png

带入隐变量的后验概率，最大化样本分布的对数似然函数，求解相应的参数。

小白学习无关利益

相关文章

LDA模型分析（二）：pLSA建模与求参
pLSA建模与求参 pLSALSA(隐性语义分析)的目的是要从文本中发现隐含的语义维度-即“Topic”或者“Co...
LDA模型分析（三）：LDA建模与求参
pLSA与LDA对比： LDA就是在pLSA的基础上加层贝叶斯框架，即LDA就是pLSA的贝叶斯版本。 pLSA与...
07 主题模型 - 知识补充 - 概率知识、二项\多项\Beta
06 主题模型 - pLSA又称pLSI - 基于概率的潜在语义分析模型为了讲后续的LDA算法，需要补充一点数学...
LDA 与PLSA
lda先验为0的时候就是plsa,lda只不过是plsa加了dirichlet 先验，一个是MLE,一个是baye...
LDA 和 LSI 聚类效果比较
LDA独立性假设太强了，经常不是很work，而且跑起来太慢。但是数学上比较完备，模型漂亮。工程上可以用PLSA ...
LDA 与 LSA、PLSA、NMF相比
“pLSA模型的作者Thomas Hoffmann提出的机器学习算法是EM。EM是各种机器学习inference算...
08 特征工程 - 特征降维 - LDA
线性判断分析(LDA)： LDA是一种基于分类模型进行特征属性合并的操作，是一种有监督的降维方法。 LDA原理 L...
10 主题模型 - 代码案例一 - LDA主题模型初识
08 主题模型 - LDA09 主题模型 - LDA参数学习-Gibbs采样安装 lda 库使用第三方的lda库...
Task4模型调参
学习目标了解常用的机器学习模型，并掌握机器学习模型的建模与调参流程内容介绍线性回归模型：线性回归对于特征的要...
LDA建模
数据：首先我们来看一眼数据：语料库中有9篇文档，每篇文档为1行。数据保存在文件名为16.LDA_test.txt...

网友评论

算法小白菜

本文标题：LDA模型分析（二）：pLSA建模与求参

本文链接：https://www.haomeiwen.com/subject/jcnbgftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

算法小白菜

热点阅读

算法小白菜

关于我们|服务条款|联系我们|LDA模型分析（二）：pLSA建模与求参|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！