R语言实战--第7章

作者: 明明就_faf8 | 来源:发表于2019-05-24 21:49 被阅读0次

    7.1 描述性统计分析

    1.描述性统计量命令

    \color{red}{(1) summary()函数}--自带

    如:summary(mtcars[vars]) # var代表mtcars中的某一个变量
    

    注:summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。


    \color{red}{(2) fivenum()函数}--自带
    函数fivenum()可返回图基五数总括( Tukey’s five-number summary,即最小值、下四分位数、中位数、上四分位数和最大值)。


    \color{red}{(3) apply()或sapply()函数}--自带
                                    ---具体用法见《R语言实战》P130


    \color{red}{(4) describe()函数}--非自带
    Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数,以及五个最大的值和五个最小的值。


    \color{red}{(5) stat.desc()函数}--非自带
    pastecs包中有一个名为stat.desc()的函数

    • basic=TRUE(默认值),则计算其中所有值、空值、缺失
      值的数量,以及最小值、最大值、值域,还有总和。
    • desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。
    • norm=TRUE(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro– Wilk正态检验结果。

    \color{red}{(6) psych包中的describe()函数}--非自带
    psych包也拥有一个名为describe()的函数。它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。

    psych包Hmisc包均提供了名为describe()的函数。
    问:R如何知道该使用哪个呢?
    答:最后载入的程序包优先。

    2.分组计算描述性统计量

    强制转行在文字前加

    <br>
    

    相关文章

      网友评论

        本文标题:R语言实战--第7章

        本文链接:https://www.haomeiwen.com/subject/xqcozqtx.html