R文本分析（三）

作者: 小豆角lch | 来源:发表于2017-07-20 14:40 被阅读0次

R文本分析（三）
R文本分析（一）
R文本分析（二）
QQ文本分析—R语言
R语言数据挖掘-文本分析(1)
R文本挖掘：文本主题分析topic analysis
r语言-关联规则-文本分析-三国人物分析
R语言爬虫与文本分析
基于R的文本分析01
R文本挖掘：社会网络分析

主题模型训练

############################################

library(lda)

corpus <- lexicalize(sample.words, lower=TRUE)

num.topics <- 4#4个主题

## Initialize the params

params <- sample(c(-1, 1), num.topics, replace=TRUE)

poliblog.ratings<- sample(c(-100, 100), 207, replace=TRUE)

result <- slda.em(documents=corpus$documents,

K=num.topics,

vocab=corpus$vocab,

num.e.iterations=30,

num.m.iterations=12,

alpha=1.0, eta=0.1,

poliblog.ratings / 100,

params,

variance=0.25,

lambda=1.0,

logistic=FALSE,

method="sLDA")

## Make a pretty picture.

Topics <- apply(top.topic.words(result$topics, 8, by.score=TRUE),

2, paste, collapse=" ")

aa=length(Topics)

t=c()

for(i in 1:aa)

{t[i]=paste(i,Topics[i],sep="")}

a=apply(result$document_sums,

1,sum)

names(a)<-t

p=data.frame(a=t,b=a)

p=p[order(p[,2],decreasing=T),]

a1=c()

c=c("a","b","c","d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z"

,"za","zb","zc","zd")

for(i in 1:aa)

{

a1[i]= paste(c[i],p$a[i],sep="")

}

p1=data.frame(a=a1,主题得分=p$b)

library(ggplot2)

ggplot(data=p1, aes(x=a, y=主题得分, fill=主题得分)) +

geom_bar(colour="black", stat="identity") +

labs(x = "主题", y = "得分") + ggtitle("文档主题排名顺序")+ coord_flip()

Topics <- top.topic.words(result$topics, 20, by.score=TRUE)

a=c()

b=c()

for(i in 1:5)

{

a=c(a,Topics[,i])

b=c(b,rep(paste("主题",i,sep=""),20))

}

a = table(a, b)

a = as.matrix(a)

library(wordcloud)

comparison.cloud(a, scale = c(1, 1.5), rot.per = 0.5, colors = brewer.pal(ncol(a),

"Dark2"))

主题1：金融主题2 ：禅道主题3 ：军事主题4 科技

网友评论

本文标题：R文本分析（三）

本文链接：https://www.haomeiwen.com/subject/jgodkxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

R文本分析（三）

相关文章