ggplot2回顾(1): 认识ggplot2

作者: TOP生物信息 | 来源:发表于2019-09-29 00:41 被阅读0次

    1. 准备工作

    library(ggplot2)
    library(tidyverse)
    #设置随机数种子,产生小数据集
    set.seed(1410)
    dsmall <- diamonds[sample(nrow(diamonds),100), ]
    

    2. ggplot2画图尝试

    diamonds %>% ggplot(aes(x=log(carat), y=log(price)))+geom_point()
    diamonds %>% ggplot(aes(x=carat, y=x*y*z))+geom_point()
    

    问题1:为什么是指数型的就需要这样转换:x和y同时取log?书中是这样写的,和我的认知不一致。

    3. 关于图形属性

    颜色,大小(size),形状,其他(alpha: 1完全不透明; 0完全透明)

    dsmall %>% ggplot(aes(x=carat, y=price, colour=color))+geom_point()
    dsmall %>% ggplot(aes(x=carat, y=price, shape=cut))+geom_point()
    ##这一步有什么提示信息。ordinal variable是指什么?
    ## Warning message:
    ##   Using shapes for an ordinal variable is not advised
    dsmall %>% ggplot(aes(x=carat, y=price, shape=color))+geom_point()
    ##默认只能处理6种shape;当大于6个时只能手动定义shape
    

    问题2:如何手动设置shape?
    问题3:标度是什么?一个函数,作用是将数据的值映射到属性的值,比如cut有5个值,将这5个值依次对应上shape属性的5个值(就是具体的形状)

    dsmall %>% ggplot(aes(x=carat, y=price, colour=color, size=dsmall$price))+geom_point()
    

    问题4:什么时候映射到颜色和形状?什么时候映射到大小?

    4. 几何对象

    问题5:二维变量关系可以画哪些图?一维变量关系可以画哪些图?
    点、线(曲线,折线)、箱型图(其中一维是离散的)
    直方图、密度曲线、频率多边形;条形图

    问题6:如何更改几何对象绑定的统计变换?以直方图为例

    4.1 点线图
    dsmall %>% ggplot(aes(x=carat, y=price))+geom_point()+geom_smooth()
    dsmall %>% ggplot(aes(x=carat, y=price))+geom_point(aes(color=color))+geom_smooth(se=F, span=1)
    ##se=F表示不加标准误;span=1表示线尽可能直一些
    

    问题7:请试试下面的代码,跟上面有一点点不同,为什么有这种不同?

    dsmall %>% ggplot(aes(x=carat, y=price, color=color))+geom_point()+geom_smooth(se=F, span=1)
    ##再试试,跟上面一样吗?
    dsmall %>% ggplot(aes(x=carat, y=price))+geom_point(aes(color=color))+geom_smooth(se=F, span=1, aes(color=color))
    

    重要结论:在一个几何对象中,一个分类变量被映射到一个图形属性,几何对象会自动按照这个变量分类

    4.2 箱型图

    问题8:箱线图有哪些图形属性?

    diamonds %>% ggplot(aes(x=color, y=price/carat))+geom_boxplot(colour="blue", fill="green", size=2)
    

    问题9:为什么上面的代码中几何对象中没有用到aes()

    4.3 直方图
    ggplot(diamonds, aes(x=diamonds$carat))+geom_histogram(bins=100, fill="light blue")
    ggplot(diamonds, aes(x=diamonds$carat, y=..density..))+geom_histogram(bins=100, fill="light blue")
    

    问题10:上面两个都是直方图,有什么区别?

    ggplot(diamonds, aes(x=diamonds$carat))+geom_density(color="light blue")
    

    问题11:这个图和上面哪个图最像?第二个。如何组合直方图和密度图?如下

    ggplot(diamonds, aes(x=diamonds$carat, y=..density..))+geom_histogram(bins=100, fill="light blue")+geom_density(color="light blue")
    

    问题12:binwidth和bins的区别?

    4.4 条形图
    ggplot(diamonds, aes(x=diamonds$color))+geom_bar(aes(fill=diamonds$cut))
    
    4.5 路径图
    economics %>% ggplot(aes(x=unemploy/pop, y=uempmed))+geom_path(aes(colour=lubridate::year(date)))
    

    问题13:结合书本上的结论理解上面的路径图

    5. 分面

    diamonds %>% ggplot(aes(x=carat, y=price))+geom_point()+facet_grid(color~cut)
    

    6. 其他选项

    dsmall %>% ggplot(aes(x=carat, y=price))+geom_point()+geom_smooth()+xlim(0,2)+ylim(0,15000)+xlab("重量")+ylab("价格")
    

    7. 尝试一下,仍然是问题7的结论

    ggplot(diamonds, aes(x=diamonds$carat))+geom_density(aes(color=diamonds$color, fill=diamonds$color), alpha=0.1)
    ggplot(diamonds, aes(x=diamonds$carat))+geom_histogram(bins=100, aes(fill=diamonds$color))
    

    reference

    《ggplot2: 数据分析与图形艺术》

    相关文章

      网友评论

        本文标题:ggplot2回顾(1): 认识ggplot2

        本文链接:https://www.haomeiwen.com/subject/ikyxpctx.html