美文网首页深度分析R语言绘图
懒人专属!自动生成数据分析报告

懒人专属!自动生成数据分析报告

作者: 生信宝库 | 来源:发表于2021-12-08 09:41 被阅读0次

    前言

    如今这个时代四处都充斥着大数据,如何从中快速获得关键信息并加以利用是决定成败的关键,编程语言是实现这个目标的利器之一。程序员利用编程语言可以同时开展多份工作,而且准确性比人工要高很多,我们不是程序员,不懂代码。但是我们即使是管中窥豹,也可以从中学习一些知识运用于我们自己遇到的问题中。

    作为对生命科学工作者最友好的编程语言--R,近几年也在迅速发展,功能也越来越多元化。今天小编就来介绍一款可以自动生成数据分析报告的R包--FactoInvestigate,只需要给它提供你想分析的数据就可迅速为我们分析,同时自动生成报告,这可真是懒人福利。


    代码实现

    为了方便大家自己尝试这些分析流程,小编下面就使用它的示例数据进行演示。

    install.packages("FactoInvestigate")
    
    library("FactoMineR")
    library("FactoInvestigate")# 导入示例数据
    data(children)
    children  #数据是一个有18行8列的孩子基本信息的数据框
    #             unqualified cep bepc high_school_diploma university thirty fifty more_fifty
    money                  51  64   32                  29         17     59    66         70
    future                 53  90   78                  75         22    115   117         86
    unemployment           71 111   50                  40         11     79    88        177
    circumstances           1   7    5                   5          4      9     8          5
    hard                    7  11    4                   3          2      2    17         18
    economic                7  13   12                  11         11     18    19         17
    egoism                 21  37   14                  26          9     14    34         61
    employment             12  35   19                   6          7     21    30         28
    finances               10   7    7                   3          1      8    12          8
    war                     4   7    7                   6          2      7     6         13
    housing                 8  22    7                  10          5     10    27         17
    fear                   25  45   38                  38         13     48    59         52
    health                 18  27   20                  19          9     13    29         53
    work                   35  61   29                  14         12     30    63         58
    comfort                 2   4    3                   1          4     NA    NA         NA
    disagreement            2   8    2                   5          2     NA    NA         NA
    world                   1   5    4                   6          3     NA    NA         NA
    to_live                 3   3    1                   3          4     NA    NA         NA
    #一句代码实现关联分析
    res.ca = CA(children, row.sup = 15:18, col.sup = 6:8, graph = FALSE)
    #导出结果
    Investigate(res.ca, file = "CA.Rmd", document = "html_document")
    

    报告内容

    在运行完上述代码后,在当前文件夹下会生成一个CA.html的网页报告,大家可以自己在浏览器中打开进行查看,主要内容如下:

    图片

    在第一部分内容中主要是对数据基本信息进行的一个统计描述,因为这个数据比较简单所以看不出太多信息,当我们实际数据很大时就很方便我们寻找出核心有用信息了。此外,整个报告都是英文的,可以之间方便与国外朋友分享。

    图片

    Fig3是汇出一个功能因子图,从这里我们可以看出在这个数据中,各种因素的权重分布情况;Fig4是一个分类图,从这个图我们可以通过各因素将这些孩子按照不同特点分为几类,从而根据我们关注的因素挑选出合适对象。


    其它分析

    当然,这么功能强大的R包肯定不只上述一种分析,它还能进行主成分分析以及多元相关性分析,感兴趣的小伙伴可以自行研究一下。

    #主成分分析data(decathlon)
    res.pca <- PCA(decathlon, quanti.sup = 11:12, quali.sup = 13, graph = FALSE)
    Investigate(res.pca, file = "PCA.Rmd", document = "pdf_document",             parallel = TRUE)            
    
    # 多元相关分析
    data(tea)
    res.mca = MCA(tea, quanti.sup = 19,quali.sup = 20:36, graph = FALSE)
    Investigate(res.mca, file = "MCA.Rmd", document = c("word_document", "pdf_document"))
    

    小结

    我们在实际应用中可以先使用FactoInvestigate包的三项功能对我们的数据进行初步分析,在找出比较重要的因素后再进行人工重点解析,这样就可以更全面的评估我们实验或者统计得来的一手数据。

    生信宝库会在接下来的时间内推出R语言活学活用专题,专门给大家介绍各种R语言可视化和小技巧,敬请期待!

    相关文章

      网友评论

        本文标题:懒人专属!自动生成数据分析报告

        本文链接:https://www.haomeiwen.com/subject/pyozxrtx.html