前言
如今这个时代四处都充斥着大数据,如何从中快速获得关键信息并加以利用是决定成败的关键,编程语言是实现这个目标的利器之一。程序员利用编程语言可以同时开展多份工作,而且准确性比人工要高很多,我们不是程序员,不懂代码。但是我们即使是管中窥豹,也可以从中学习一些知识运用于我们自己遇到的问题中。
作为对生命科学工作者最友好的编程语言--R,近几年也在迅速发展,功能也越来越多元化。今天小编就来介绍一款可以自动生成数据分析报告的R包--FactoInvestigate,只需要给它提供你想分析的数据就可迅速为我们分析,同时自动生成报告,这可真是懒人福利。
代码实现
为了方便大家自己尝试这些分析流程,小编下面就使用它的示例数据进行演示。
install.packages("FactoInvestigate")
library("FactoMineR")
library("FactoInvestigate")# 导入示例数据
data(children)
children #数据是一个有18行8列的孩子基本信息的数据框
# unqualified cep bepc high_school_diploma university thirty fifty more_fifty
money 51 64 32 29 17 59 66 70
future 53 90 78 75 22 115 117 86
unemployment 71 111 50 40 11 79 88 177
circumstances 1 7 5 5 4 9 8 5
hard 7 11 4 3 2 2 17 18
economic 7 13 12 11 11 18 19 17
egoism 21 37 14 26 9 14 34 61
employment 12 35 19 6 7 21 30 28
finances 10 7 7 3 1 8 12 8
war 4 7 7 6 2 7 6 13
housing 8 22 7 10 5 10 27 17
fear 25 45 38 38 13 48 59 52
health 18 27 20 19 9 13 29 53
work 35 61 29 14 12 30 63 58
comfort 2 4 3 1 4 NA NA NA
disagreement 2 8 2 5 2 NA NA NA
world 1 5 4 6 3 NA NA NA
to_live 3 3 1 3 4 NA NA NA
#一句代码实现关联分析
res.ca = CA(children, row.sup = 15:18, col.sup = 6:8, graph = FALSE)
#导出结果
Investigate(res.ca, file = "CA.Rmd", document = "html_document")
报告内容
在运行完上述代码后,在当前文件夹下会生成一个CA.html的网页报告,大家可以自己在浏览器中打开进行查看,主要内容如下:
在第一部分内容中主要是对数据基本信息进行的一个统计描述,因为这个数据比较简单所以看不出太多信息,当我们实际数据很大时就很方便我们寻找出核心有用信息了。此外,整个报告都是英文的,可以之间方便与国外朋友分享。
Fig3是汇出一个功能因子图,从这里我们可以看出在这个数据中,各种因素的权重分布情况;Fig4是一个分类图,从这个图我们可以通过各因素将这些孩子按照不同特点分为几类,从而根据我们关注的因素挑选出合适对象。
其它分析
当然,这么功能强大的R包肯定不只上述一种分析,它还能进行主成分分析以及多元相关性分析,感兴趣的小伙伴可以自行研究一下。
#主成分分析data(decathlon)
res.pca <- PCA(decathlon, quanti.sup = 11:12, quali.sup = 13, graph = FALSE)
Investigate(res.pca, file = "PCA.Rmd", document = "pdf_document", parallel = TRUE)
# 多元相关分析
data(tea)
res.mca = MCA(tea, quanti.sup = 19,quali.sup = 20:36, graph = FALSE)
Investigate(res.mca, file = "MCA.Rmd", document = c("word_document", "pdf_document"))
小结
我们在实际应用中可以先使用FactoInvestigate包的三项功能对我们的数据进行初步分析,在找出比较重要的因素后再进行人工重点解析,这样就可以更全面的评估我们实验或者统计得来的一手数据。
生信宝库会在接下来的时间内推出R语言活学活用专题,专门给大家介绍各种R语言可视化和小技巧,敬请期待!
网友评论