美文网首页
数据可视化笔记-R语言

数据可视化笔记-R语言

作者: farland | 来源:发表于2019-03-25 10:01 被阅读0次

<<Data Visualization and Exploration with R>> by Eric Pimpler

定义

Exploratory Data Analysis (EDA)
目的:理解数据
步骤:

  1. 产生问题
  2. 对数据进行可视化,并寻找答案
  3. 改进或提出新的问题

数据类型

  • categorical 离散变量,有限的小数据
  • continuous 连续变量, 无限地,有序的

可视化的用途

发现变量的变化或多个变量之间的共变(variation or covariation)

方法

  • 条形图 : Measuring categorical variation with a bar chart.
  • 直方图 : Measuring continuous variation with a histogram,分布
  • 箱体图: Measuring covariation with boxplots
  • 符号大小:Measuring covariation with symbol size
  • 散点图:correlation 相关性

Covariation is the tendency for the values of two or more variables to vary together in a related way. The best way to spot covariation is to visualise the relationship between two or more variables

条形图示例 bar plot

diamonds-颜色条形图

X轴 = 离线变量-color,Y轴 = 每种颜色的钻石数量

直方图示例

diamonds-价格-直方图

X轴 = 连续变量-price, Y轴=每种价格的频率/数量

箱体图示例

diamonds-品质-价格

X轴 = 离线变量-cut品质,Y轴 = 价格,可以比较每种品质钻石的价格分布,比如中位值,离群值等

符号大小

diamonds,品质,颜色数量对比

散点图示例

diamonds 重量和价格对比

相关文章

  • R语言卡方检验大全

    本文首发于公众号:医学和生信笔记 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R...

  • 决策曲线分析DCA用于lasso回归/随机森林

    本文首发于公众号:医学和生信笔记 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R...

  • TCGA下载和表达矩阵整理:最适合初学者的教程

    本文首发于公众号:医学和生信笔记 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R...

  • TCGA新版数据库表达矩阵提取

    本文首发于公众号:医学和生信笔记 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R...

  • R机器学习mlr3:基础使用

    本文首发于公众号:医学和生信笔记 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R...

  • R语言t检验

    本文首发于公众号:医学和生信笔记 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R...

  • R语言之可视化①④一页多图(1)

    目录 R语言之可视化①误差棒 R语言之可视化②点图 R语言之可视化③点图续 R语言之可视化④点韦恩图upsetR ...

  • R语言之可视化⑥R图形系统续

    目录 R语言之可视化①误差棒 R语言之可视化②点图 R语言之可视化③点图续 R语言之可视化④点韦恩图upsetR ...

  • R语言之可视化⑩坐标系统

    目录 R语言之可视化①误差棒 R语言之可视化②点图 R语言之可视化③点图续 R语言之可视化④点韦恩图upsetR ...

  • R语言之可视化⑨火山图

    目录 R语言之可视化①误差棒 R语言之可视化②点图 R语言之可视化③点图续 R语言之可视化④点韦恩图upsetR ...

网友评论

      本文标题:数据可视化笔记-R语言

      本文链接:https://www.haomeiwen.com/subject/wzfuvqtx.html