美文网首页读书笔记
读书笔记_数据可视化之美

读书笔记_数据可视化之美

作者: 煎饼果子再来一套 | 来源:发表于2019-08-14 11:09 被阅读0次

    1. 第一章

    1.1. ggplot2语法

    1.1.1. geom_xxx()与stat_xxx()

    仅当绘制图表涉及统计变换时,我们才会使用统计变换函数stat_xxx()
    函数分类
    | ggplot2函数分类 |


    扫描文稿 1.jpg

    (1)图元函数
    (2)误差函数
    geom_crossbar()绘制误差框、geom_errorbar()竖直误差线、geom_errorbarh()水平误差线、geom_pointrange()带误差棒的均值点
    此类函数,需先设置统计变换参数

    1.1.2. stat_xxx():统计变换函数

    stat()函数必须与geom()对应,才能进行数据计算
    图层概念
    stat_xxx()开始的图层
    无须设定统计变换参数,但须指定集合对象名称图表类型geom,使作图过程更加侧重统计变换过程,见以下a1
    geom_xxx()绘制的图层
    更侧重图表类型的绘制,见以下b1
    当绘制的图表不涉及统计变换时,可直接使用geom_xxx()函数,无须设定stat参数,stat参数默认值为stat='identity'(无数据变换)

    #a1
    ggplot(mydata, aes(Class, Value.fill = Class)) + stat_summary(fun.y = 'mean', fun.args = list(mult = 1), geom = 'point' , color = 'white', size = 4) 
    #b1
    ggplot(mydata, aes(Class, Value.fill = Class)) + geom_point(stat = 'summary', fun.y = 'mean',fun.args = list(mult = 1), color = 'white', size = 4)
    

    1.1.3. 视觉通道映射

    参数包括:
    color/col/colour、fill、size、angle、linetype、shape、vjust和hjust。
    linetype、shape等部分参数只适用于类别型变量
    列出几个需要注意的参数
    (1)angle:仅部分集合对象有,如geom_text()中文本的摆放角度
    (2)vjust指垂直位置微调,在(0,1)区间,0 = 'buttom', 0.5 = 'middle', 1 = 'top';hjust指水平位置微调,在在(0,1)区间,0 = 'left', 0.5 = 'center', 1 = 'right'。
    (3)color/col/colour指轮廓的颜色,fill指填充区域的颜色

    扫描文稿 2.jpg

    1.1.4. 度量调整

    度量用于控制变量映射到视觉对象的具体细节


    扫描文稿 3.jpg 扫描文稿 4.jpg

    aes()内部、外部的区别
    (1)内部,指定的视觉通道映射参数需个性化映射时,写于内部
    (2)外部,统一设定某些图标元素对象(共性、统一化)时,写于外部,所有观测值会按统一树形进行映射

    data("iris")
    library(ggplot2)
    str(iris)
    colnames(iris)
    ggplot(iris,aes(x=Sepal.Length, y=Sepal.Width,fill=Species))+
      geom_boxplot()
    ggplot(iris,aes(x=Sepal.Length, y=Sepal.Width,,group=Species) )+
      geom_boxplot(fill = 'lightblue')
      
    

    1.1.5. 坐标系

    三种坐标系:
    直角坐标系、极坐标系、地理坐标系

    data("iris")
    library(ggplot2)
    str(iris)
    colnames(iris)
    ggplot(iris,aes(x=Sepal.Length, y=Sepal.Width,fill=Species))+
      geom_bar(stat = 'identity') #直角坐标系
    ggplot(iris,aes(x=Sepal.Length, y=Sepal.Width,fill=Species))+
      geom_bar(stat = 'identity')+
      coord_polar() #极坐标系
    ggplot(iris,aes(x=Sepal.Length, y=Sepal.Width,fill=Species))+
      geom_bar(stat = 'identity')+
      coord_map() #地理坐标系,这个例子呈现比较差,但是我懒得找了。。。。
    

    坐标轴度量
    结合我的个人需要,我比较关注对数坐标轴度量,分类坐标轴度量,顺序坐标轴度量


    扫描文稿 1 2.jpg

    时间坐标轴度量
    时间是连续变量,可以对应到线性度量,也可以划分时刻、星期、月份、季节或年份

    相关文章

      网友评论

        本文标题:读书笔记_数据可视化之美

        本文链接:https://www.haomeiwen.com/subject/dstgjctx.html