初识ggplot2:2018-11-29

作者: Datacat | 来源:发表于2018-12-03 17:19 被阅读5次

    一、安装

    RStudio有网页版和软件版

    软件版则需要下载安装ggplot2包,运行如下命令:

    ggplot2包中自带一套数据(关于大众汽车燃油经济性)可用于学习

    二、导入包和类还有集:

    关于这套数据的说明:

    cyl:汽缸的数目

    cty:城市和高速公路行驶记录每加仑行驶的英里数(miles per gallon,mpg)

    hwy:高速公路耗油量

    displ:发动机排量(L)

    drv:动力传动系统(前轮f,后轮r,四轮4)

    model:汽车模型(选择了38款)

    class(未显示全):描述汽车种类的变量(双座,SUV,紧凑型,小型货车,小卡车,微型小客车)

    三、散点图学习

    ggplot2制图形有三个重要的组成部分 

    1. 数据 

    2. 数据和视觉变量属性之间的映射(aesthetic mappings) 

    3. 呈现数据结果的图层(一般使用geom()函数)

    利用图形属性(颜色和形状)可以来比较不同分组)。图形的颜色、大小和形状等都是给绘图添加的额外变量,即标度(scale),添加在函数aes() 的参数中(注:class、drv、cyl等是数据集中的类别名称):

    - aes(displ, hwy, colour = class)

    - aes(displ, hwy, shape = drv)

    - aes(displ, hwy, size = cyl)

    在此我们只用颜色来做维度。

    我们看下displ和hwy相关性的散点图,图中点的颜色是是由第三个变量(汽车种类)决定。脚本如下,图形如下:

    发动机排量对高速公路耗油量的散点图

    结论:发现他们呈现负相关关系。分析得出影响耗油量的一个重要因素是发动机排量。

    四、条形图学习

    翻转笛卡尔坐标,使水平变成垂直,垂直,水平。这主要用于将显示x上的y条件的地理和统计信息转换为y上的x条件。

    相关文章

      网友评论

        本文标题:初识ggplot2:2018-11-29

        本文链接:https://www.haomeiwen.com/subject/ilgxcqtx.html