美文网首页生物信息学Cook R生物信息学
《ggplot2:数据分析与图形艺术》笔记3:用图层构建图像

《ggplot2:数据分析与图形艺术》笔记3:用图层构建图像

作者: 曹务强 | 来源:发表于2018-01-02 22:52 被阅读48次

    在前面的练习中,我们使用qplot练习作图,作为ggplot2的快速入门。然而,qplot的局限性在于它只能使用一个数据集和一组图形属性映射,当我们要进行复杂数据的统计分析时,qplot就不够用了。解决这一问题的方法就是使用图层,每一个图层可以有属于自己的数据集和图形属性映射,附加的数据元素可以通过图层添加到图形中。

    创建绘图对象

    当我们调用qplot()时,它其实为我们做了许多幕后工作:

    1. 创建一个图形对象
    2. 添加图层并展示结果
      如果想手动创建图形对象,就要使用ggplot()函数。该函数有两个主要的参数:数据和图形属性映射
      数据:指定绘图所使用的默认数据集(必须是数据框)
      映射:将图形属性和变量名放在函数aes()的括号中即可创建映射

    比如,通过下面的代码,即可创建一组默认映射:

    #x为carat,y为price,colour为cut
    p <- ggplot(diamonds, aes(carat, price, colour = cut))
    

    不过,上面的图形对象在加上图层之前是无法显示的。

    图层

    创建好绘图对象后,我们可以使用+来添加图层:

    p + geom_point()
    

    再通过添加图层而添加几何对象时,我们需要注意:每一个几何对象都对应着一个默认的统计变换和位置参数,而每一个统计变换都对应着一个默认的几何对象参数。所以对于一个图层,我们只需要设定stat或geom参数即可。

    数据

    • ggplot2要求数据集必须是一个数据框(data frame)
    • ggplot2会从我们给定的数据框中提取绘图所需的变量,并生成一个新的数据集,而不是直接在原数据上进行数据变换
    • 使用ggplot2作图时,数据是以副本二不是引用的形式存储在图形对象中的,这样可以使我们:
    • 1.即使数据改变了,绘图不会改变
    • 2.ggplot2的对象都是自含型的,所以它可以被存储到磁盘上,并可被直接加载(load())运行

    图形属性映射

    aes()函数用来将数据变量映射到图形中,从而使变量成为可以被感知的图形属性。
    aes()函数中有一系列的图形属性参数:

    #创建映射
    aes(x = weight, y = height, colour = age)
    #x,y可以省略,直接输入映射值
    aes(weight, height, colour = age)
    

    几何对象

    几何对象,简称为geom,它执行着图层的实际渲染,控制着生成的图像类型。

    • 每一个几何对象都有一组它能识别的图形属性和一组绘图所需的值。
    • 每一个几何对象都有一个默认的统计变换,并且每一个统计变换都有一个默认的几何对象。

    统计变换

    统计变换。简称为stat,即对数据进行统计变换,它通常以某种方式对数据信息进行汇总。

    • 统计变换可将输入的数据集看做输入,将返回的数据集作为输出,因此统计变换可向元数据集中插入新的变量。例如用来绘制直方图的stat_bin统计变量会生成如下的变量:
    • count:每个组里观测值得数目;
    • density:每个组里观测值的密度(占整体的百分数/组宽)
    • x:组的中心位置
    • 这些生成变量可被直接调用,调用生成变量时,必须使用..将其名字围起来,以和原数据集中的变量区分
      比如:
    ggplot(diamonds, aes(carat)) + geom_histogram(aes(y = ..density..), binwidth = 0.1)
    

    位置调整

    位置调整:是对图层中的元素位置进行微调。位置调整一般多见于处理离散型数据,连续型数据一般很少出现完全重叠的问题。

    常用的位置调整参数见下图:


    整合

    一旦熟悉了图层操作,就可以把本章所介绍的各种图层功能结合起来,轻松做出复杂的图形。

    结合几何对象和统计变换

    将几何对象和不同的统计变换进行组合,可以轻松做出新颖的图形。下面,我们基于相同的直方图的统计变换,使用不同的几何对象,以不同的形式来展示结果:面积、点和瓦块图。

    # 创建绘图对象
    d <- ggplot(diamonds, aes(carat)) + xlim(0,3)
    # 对数据进行统计变换,并绘制面积图层
    d + stat_bin(aes(ymax = ..count..), binwidth =0.1 , geom ="area")
    # 对数据进行统计变换,并绘制点图图层
    d + stat_bin(aes(size = ..density..), binwidth = 0.1, geom = "point"
    , position = "identity")
    # 对数据进行统计变换,并绘制瓦块图图层
    d + stat_bin2d(aes(y = 1, fill = ..count..), binwidth = 0.1, geom = "tile", position = "identity")
    

    绘制面积图图层:


    Rplot01.png

    绘制点图图层:


    Rplot02.png

    绘制瓦块图图层:


    Rplot03.png

    相关文章

      网友评论

        本文标题:《ggplot2:数据分析与图形艺术》笔记3:用图层构建图像

        本文链接:https://www.haomeiwen.com/subject/tplcnxtx.html