美文网首页R语言快速入门
R语言 基本统计分析

R语言 基本统计分析

作者: 数据驱动实践 | 来源:发表于2020-05-25 12:47 被阅读0次

    原创文地址:https://mp.weixin.qq.com/s/URD3Lz69fY8CKdKT3IcNJQ

    本章节是数据预处理的第一步:了解数据(集)。只有充分了解了数据,我们才能对数据做进一步的预处理和后续深入的分析。

    目录

    1 数据结构

    str()

    dim()

    head()

    2 描述性统计分析

    summary()

    psych::describe()

    分组计算doBy::summaryBy

    分组计算psych::describeBy

    3 频数和列联表

    table 一维计数

    xtabs 多维(交叉)计数

    gmodels::CrossTable #列联表

    01

    数据结构

    严格来讲“数据结构”不是基本统计分析的内容,但是这是了解数据的第一步,因此这里做简单普及!推荐使用str()函数

    class() # 数据类型
    
    image

    图1 View(mtcars)

    > data(mtcars) 
    
    > str(mtcars)
    

    02

    描述性统计分析

    描述性统计分析主要是认识数据的整体状况,例如是否缺失、均值、方差、中位数等描述性统计变量。推荐使用****summary()、psych::describe()

    ## 描述统计
    

    summary()函数提供了最小值、最大值、四分位数、均值,另外还可以因子向量和逻辑型向量的频数统计。

    > summary(mtcars)
    

    psych::describe(mtcars) #推荐使用

    > psych::describe(mtcars)
    

    分组计算的扩展,doBy包和psych包提供了分组计算的描述性统计量的函数,doBy包中的summaryBy()函数使用的基本格式:

    # doBy()包中summaryBy()函数的使用格式:
    
    library(psych)
    

    03

    频数和列联表

    推荐学习使用table****、xtabs、gmodels::CrossTable

    ## 2.频数和列联表
    

    示例

    > ## 2.频数和列联表
    

    获取源代码请至”数据驱动实践“公众号后台回复:20200524

    【往期回顾推荐】

    R 语言 逻辑运算:TRUE/FALSE

    R语言入门到可视化精选19题

    R语言 高阶可视化绘图系统:ggplot2入门

    R语言,入门首看、必看基础概述

    R语言数据管理与dplyr、tidyr

    快速掌握R语言中的apply函数族 | 精选分享

    R语言 分组计算,不止group_by

    用R语言让你的可视化图表动起来!动起来!!附源代码

    R语言 相关系数混合可视化矩阵实现

    《R数据科学》是一本专门讲解tidyverse相关包的书籍,主要涉及dplyr、tidyr、ggplot2、purrr等,非常值得学习,基本上此一本书可以解答数据处理的大部分问题

    相关文章

      网友评论

        本文标题:R语言 基本统计分析

        本文链接:https://www.haomeiwen.com/subject/ebfxjctx.html