番外.1

作者: 半夜一更 | 来源:发表于2021-03-10 21:00 被阅读0次
昨天有个以前的同学提了个需求,大概是这样的: image.png

计算单词的P评论数。
昨天忙不过来,到今天才把脚本写掉,具体思路是这样的:

# install.packages("openxlsx") #安装打开excel文件的包
library(openxlsx) #载入打开excel文件的包
getwd() #查看当前工作环境目录
setwd('XXX') #设置当前工作环境目录
rm(list=ls()) #清除缓存
data_raw <- read.xlsx("副本数据分析.xlsx",rowNames = F,sheet=1) #载入数据

dir_all <- NULL #设置一个空数据集
for(j in 1:length(data_raw$Title)){
  title <- noquote(data_raw$Title[j]) #读取第j个标题
  title <- gsub("\\("," ",gsub("\\)"," ",title)) #空格替换(和)
  title <- gsub("\\,"," ",gsub("\\,"," ",title))#空格替换,和,
  title <- gsub("\\["," ",gsub("\\]"," ",title)) #空格替换[和]
  title <- gsub("\\/"," ",title) #空格替换/
  title <- gsub("\\|"," ",title) #空格替换|
  dir <-unlist(strsplit(title," ", fixed=TRUE))  #以空格分割单词
  #dir <-unique(unlist(strsplit(title," ", fixed=TRUE))) #以空格分割单词,删除重复的单词
  num_review <- data_raw$Num[j] #提取该条标题对应的评论数
  for(i in 1:length(dir)){
    dir_all <- c(dir_all,rep(dir[i],num_review)) #以评论的次数复制该条标题的单词,然后追加到最开始设置的数据集中
  }
}
#统计数据集中的单词的频次
word <- unique(dir_all) #
result <- NULL
for(k in 1:length(word)){
  row <- as.data.frame(sum(dir_all==word[k]),word[k])
  colnames(row) <- c("Num")
  result <- rbind(result,row)
}
#写入到csv文件中
write.csv(result,"result_20210310.csv")

先这样吧,以后如果他还有需要在优化吧。

相关文章

  • 番外1

    咔嚓。。。。咔嚓。。。。。杰森从梦里惊醒,拿起砍刀,躲在一片灌木从后,伺候杀机。突然,他看见一个巨大的身影,大概4...

  • 番外1

    恐龍哥:嗨!我們是番外舞台!我是主持人帥恐龍! 牛仔:是夠醜的。 恐龍哥:(發怒)喂!不活啦!你從哪個星球來的怪物...

  • 番外 1

    某日,某公主携某王回家省亲,把某小包子独自丢在家里。一觉醒来,某小包子发现父王母后双双消失,气得在家里哇哇大哭,抽...

  • 番外 1

    天使的诱惑

  • 番外1

  • 番外1

    人物信息卡来了,仔细看看哈(灬°ω°灬) 莫沁林 明明可以靠脸吃饭非要靠武功(dǔi réi)的女汉子 蓝思追的亲...

  • 番外1

    一天,紫暮光闪被众人摁在墙角疯狂摩擦。。。。 alex:最近都没有我们俩戏份,你不想活啦! steve:9494(...

  • 番外1

    她在走廊撞上Bright ,那時他還是人類的模樣。大致上。 「哦!天啊?」Bright 轉過身,「這不是Benne...

  • 番外1

    今天我在时光手账上做了个封面,你们凑合着看看吧↓ 我真的要推荐一下这个手账软件↓ 这个软件一打开就是一些大佬做的手...

  • 番外1

    我计划的情节接下来就要开始疯狂撒玻璃渣子了,有一些设想过但无法放入正文的情节就在番外给大家写出来了 帝君与凤九大婚...

网友评论

      本文标题:番外.1

      本文链接:https://www.haomeiwen.com/subject/txowqltx.html