


- 发现K个主题
- 计算每个文档包含哪些主题


此处引入了单词集,用来计算各主题的词分布。


通过调整模型的参数,使得生成数据的条件概率最大。

可以用最大似然法或贝叶斯估计找到最优值。

- MLE最大似然估计--缺点:数据太小的时候容易对模型参数估计有偏差
- MAE贝叶斯推断--缺点:需要知道先验分布

此处引入了单词集,用来计算各主题的词分布。
通过调整模型的参数,使得生成数据的条件概率最大。
可以用最大似然法或贝叶斯估计找到最优值。
本文标题:第二周
本文链接:https://www.haomeiwen.com/subject/yervuftx.html
网友评论