美文网首页
R语言数据初步探索

R语言数据初步探索

作者: 丛小贱 | 来源:发表于2018-01-07 14:38 被阅读0次

1. 初步了解数据变量情况

     attributes() 获得数据集的属性列表,对数据集结构的整体把握

     str() 获得数据的内部结构

     summary() 获得一系列统计指标值

        quantile() 计算各分位值

    describe() 获得更完整的数据分布(分位数上更细)

    basicStats() 获得更丰富的指标,方差、标准差、偏度、峰度等

        偏度:衡量数据的偏倚程度--正态分布完全对称偏度为0,[-1,1]区间对称性较强,也不存在明显的偏倚程度,>1右偏趋势反之左偏(右偏:密度分布曲线在右侧有较长尾部)

        峰度:集中与分散的程度--正态分布峰度为0,则若>0则表示对比正态分布更为陡峭,反之则更为平坦。若绝对值较大,则说明可能存在异常值

2.相关性--[-1,1]绝对值越大,相关性越大。正负表示正负向关系

    cor() 获取相关系数

    plotcorr() 绘制相关图,直观比较各变量相关程度

        圆形越窄,相关性越高

3.可视化

    hist() 直方图 

        breaks设定分组

    Ecdf() 累积分布图 -- Himsc包

    boxplot() 箱型图

        绘制分组箱型图进行交叉分析

    dotchart() 点阵图--呈现离散型变量各取值水平的分布情况

        legend() 添加图例

相关文章

  • R语言数据初步探索

    1. 初步了解数据变量情况 attributes() 获得数据集的属性列表,对数据集结构的整体把握 str...

  • 生信学习小组Day5笔记-lamyusam_

    R语言学习 今天,了解了R中的数据类型,初步学习R语言的数据结构。 R的数据类型 向量(vector) R语言中的...

  • R语言数据探索

    正态性检验: P=0.1558 接收H0 为正太分布

  • R语言图形初步

    图形初步 在本章中,我们将讨论处理图形的一般方法。我们首先探讨如何创建和保存图形,然后关注如何修改那些存在于所有图...

  • R语言基础--数据类型-总结

    R语言基础--数据类型-总结 1、R语言基础--数据类型之向量 2、R语言基础--数据类型之因子 3、R语言基础-...

  • day5 阿来

    继续学习R语言 R语言数据学习 数据R语言学习.png 数据输入 数据输出 总结 R语言学习的第二天,熟悉了很多操...

  • 学习小组Day4笔记--初识R语言(JINKUN)

    前一阵子初步接触了linux,今天进入了令人激动的R语言初步学习环节 一、安装R语言和Rstudio 首先一个必须...

  • R语言从入门到精通:Day5

    经过前面几次推文的学习,相信大家对R语言已经有了一个大概的了解,同时也初步感受了R语言在数据处理领域的强大功能,不...

  • 【科研猫】R语言从入门到精通:Day5

    经过前面几次推文的学习,相信大家对R语言已经有了一个大概的了解,同时也初步感受了R语言在数据处理领域的强大功能,不...

  • 学习笔记Day4+5 by康康

    认识R和Rstudio 先前已有初步的基础,也已安装 R语言基础 操作截屏

网友评论

      本文标题:R语言数据初步探索

      本文链接:https://www.haomeiwen.com/subject/yhipnxtx.html