我尝试使用Latent Dirichlet分配LDA来提取一些主题。 本教程以端到端的自然语言处理流程为特色,从原始数据开始,贯穿准备,建模,可视化论文。
我们将涉及以下几点
使用LDA进行主题建模
使用pyLDAvis可视化主题模型
使用t-SNE和散景可视化LDA结果
In[1]:
from scipy import sparse as sp
need-to-insert-img
Populating the interactive namespace from numpy and matplotlib
need-to-insert-img
In[2]:
docs = array(p_df['PaperText'])
need-to-insert-img
预处理和矢量化文档
In[3]:
分享:
网友评论