美文网首页
R文本分析(三)

R文本分析(三)

作者: 小豆角lch | 来源:发表于2017-07-20 14:40 被阅读0次

主题模型训练

############################################

library(lda)

corpus <- lexicalize(sample.words, lower=TRUE)

num.topics <- 4#4个主题

## Initialize the params

params <- sample(c(-1, 1), num.topics, replace=TRUE)

poliblog.ratings<- sample(c(-100, 100), 207, replace=TRUE)

result <- slda.em(documents=corpus$documents,

K=num.topics,

vocab=corpus$vocab,

num.e.iterations=30,

num.m.iterations=12,

alpha=1.0, eta=0.1,

poliblog.ratings / 100,

params,

variance=0.25,

lambda=1.0,

logistic=FALSE,

method="sLDA")

## Make a pretty picture.

Topics <- apply(top.topic.words(result$topics, 8, by.score=TRUE),

2, paste, collapse=" ")

aa=length(Topics)

t=c()

for(i in 1:aa)

{t[i]=paste(i,Topics[i],sep="")}

a=apply(result$document_sums,

1,sum)

names(a)<-t

p=data.frame(a=t,b=a)

p=p[order(p[,2],decreasing=T),]

a1=c()

c=c("a","b","c","d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z"

,"za","zb","zc","zd")

for(i in 1:aa)

{

a1[i]= paste(c[i],p$a[i],sep="")

}

p1=data.frame(a=a1,主题得分=p$b)

library(ggplot2)

ggplot(data=p1, aes(x=a, y=主题得分, fill=主题得分)) +

geom_bar(colour="black", stat="identity") +

labs(x = "主题", y = "得分") + ggtitle("文档主题排名顺序")+ coord_flip()

Topics <- top.topic.words(result$topics, 20, by.score=TRUE)

a=c()

b=c()

for(i in 1:5)

{

a=c(a,Topics[,i])

b=c(b,rep(paste("主题",i,sep=""),20))

}

a = table(a, b)

a = as.matrix(a)

library(wordcloud)

comparison.cloud(a, scale = c(1, 1.5), rot.per = 0.5, colors = brewer.pal(ncol(a),

"Dark2"))

主题1:金融主题2 :禅道主题3 :军事主题4 科技

相关文章

  • R文本分析(三)

    主题模型训练 ############################################ libra...

  • R文本分析(一)

    Part1安装依赖包 http://blog.csdn.net/cl1143015961/article/deta...

  • R文本分析(二)

    文本预处理 1.设置路径 setwd("e://r语言学习//r代码") 2.加载词典 installDict("...

  • QQ文本分析—R语言

    1、参考文献 设置超链接:时间分布和成员分析;QQ聊天内容;recharts安装包官方介绍 2、读入QQ聊天记录 ...

  • R语言 数据挖掘-文本分析(1)

    刚接触R语言一周,和matab不同R作用于数据挖掘的库很多,详解见 R语言数据挖掘包,下面简介文本分析经常使用到的...

  • R文本挖掘:文本主题分析topic analysis

    对于海量未知内容文本的挖掘,主题分析是一个常见的技巧,在主题模型中,主题表示一个概念、一个方面,表现为一系列相关的...

  • r语言-关联规则-文本分析-三国人物分析

    r语言关联规则包已经非常好了,还带有可视化图形等等,但是唯一不好的是数据格式问题,第一个输入的数据格式需要转换,第...

  • R语言爬虫与文本分析

    原文链接:R语言爬虫与文本分析 微信公众号:机器学习养成记 搜索添加微信公众号:chenchenwings 之前...

  • 基于R的文本分析01

    第一步:载入分词包 第二步:装载需要分析的文本 第三步:分词 第四步:建立语料库 第五步:内容分析(聚类分析) 附图:

  • R文本挖掘:社会网络分析

    社会网络分析是综合运用图论、数学模型来研究行动者与行动者、行动者与其所处社会网络、以及一个社会网络与另一社会网络之...

网友评论

      本文标题:R文本分析(三)

      本文链接:https://www.haomeiwen.com/subject/jgodkxtx.html