美文网首页SAS学习笔记R可视化和ggplot2
ggplot2回顾(5): 数据分布的展示

ggplot2回顾(5): 数据分布的展示

作者: TOP生物信息 | 来源:发表于2019-10-21 00:58 被阅读0次

1. 连续型x能否使用箱型图

1.1 round_any()
#library(plyr)
> head(diamonds$carat,10)
[1] 0.23 0.21 0.23 0.29 0.31 0.24 0.24 0.26 0.22 0.23
> head(round_any(diamonds$carat, 0.1, floor),10)
[1] 0.2 0.2 0.2 0.2 0.3 0.2 0.2 0.2 0.2 0.2
#在0.1的倍数中,找一个k使得恰好0.1k<=i<=0.1(k+1),floor表示用左端值作为近似值
> head(round_any(diamonds$carat, 0.1, ceiling),10)
[1] 0.3 0.3 0.3 0.3 0.4 0.3 0.3 0.3 0.3 0.3
#在0.1的倍数中,找一个k使得恰好0.1k<=i<=0.1(k+1),ceiling表示用右端值作为近似值
diamonds%>%ggplot(aes(carat,depth))+geom_boxplot(aes(group=round_any(diamonds$carat, 0.5, floor)))
1.2 两个问题

1.尽管上面命令中round_any()会返回很多值,但实际只分了不到10组,所以需要想想group接收的是值的数量还是值的unique数?(后者)

2.前些天,有个同学问我一个箱线图的画法,当时他的x轴也是连续型的,我首先想到的是as.factor转一下类型,好在他的x值不多只有三十个,因此看上去问题不大,现在想想,如果x很多成百上千个,比如这里的carat,最好就不要用as.factor了,太紧凑了

diamonds%>%ggplot(aes(as.factor(carat),depth))+geom_boxplot()
1.3 正确认识箱线图
上限:上四分位数+(上四分位数-下四分位数)*1.5
下限:下四分位数-(上四分位数-下四分位数)*1.5

有时候,如果一组数据的最大值(或除去异常值后的最大值)在理论上限值以下,仍以这个最大值画横线。

2. 面积图和密度图在表示数据分布时的异同

1.都是stat="bin"
geom_density默认就是stat="bin"; geom_area默认不是,需要额外指定

2.geom_density, geom_area的position都可以分为"dodge", "fill","stack"。前者默认是"dodge", 后者默认是"stack"

diamonds%>%ggplot(aes(depth))+geom_density(aes(fill=cut,color=cut))
diamonds%>%ggplot(aes(depth))+geom_area(aes(y=..density..,fill=cut),stat="bin",position = "dodge")

相关文章

  • ggplot2回顾(5): 数据分布的展示

    1. 连续型x能否使用箱型图 1.1 round_any() 1.2 两个问题 1.尽管上面命令中round_an...

  • R语言-使用ggplot2绘制测序深度图

    本文展示如何使用ggplot2包绘制测序reads深度分布图,即用条形图来展示每个位点的测序深度,以及用饼图来展示...

  • ggplot2基础画图-小提琴图

    小提琴图由于其外形看起来酷似小提琴而得名,可以很直观的展示数据的分布,今天分享一下用ggplot2绘制小提琴的方法...

  • R绘图|ggplot2火山图的绘制

    上一期R绘图|ggplot2散点图的绘制简单介绍了散点图在高通量数据展示上的作用,以及如何绘制?散点图在数据展示上...

  • 数据的描述性分析:图表展示

    一、类别数据的图表展示 用频数分布表观察类别数据频数分布 是指由变量的取值及相应的频数形成的分布频数分布表 是展示...

  • 如何展示统计结果的表格

    今天和老板讨论,又学到了如何正确地展示统计的表格,主要分为两种:1)正态分布的数据对于正态分布的数据,数据的展示形...

  • ggplot2学习(五)

    ggplot2基础(5)——配色与图例 参考《R数据可视化手册》、《R绘图:一文了解ggplot2颜色的设置[ht...

  • 【R>>ggplot2】sec.axis第2坐标轴

    ggplot2画图展示时,可用sec.axis直接添加标签。 核心函数: 示例数据是科技公司随着时间变化的数据(时...

  • 统计学3、4章

    数据的图标展示 品质数据整理与展示 频数分布,分类数据图示(条形——帕累托图,饼图——环形图),顺序数据(累计频数...

  • 初探circlize绘制弦图

    一直以来在介绍的数据可视化案例展示中,一直是围绕ggplot2而展开的,但是R中优秀的程序包除了ggplot2还有...

网友评论

    本文标题:ggplot2回顾(5): 数据分布的展示

    本文链接:https://www.haomeiwen.com/subject/lndzmctx.html