R数据科学-day1

作者: 梦幻天堂_ccd5 | 来源:发表于2018-11-02 19:44 被阅读0次

    准备工作

    • R

    • Rstudio

    • tidyverse

    mpg

    mpg是ggplot2的内置数据框。
    dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合使用。
    本文将介绍dplyr包的下述五个函数用法:
    筛选: filter()
    排列: arrange()
    选择: select()
    变形: mutate()
    汇总: summarise()
    分组: group_by()
    以及tidyr包的下述四个函数用法:
    gather—宽数据转为长数据;
    spread—长数据转为宽数据;
    unit—多列合并为一列;
    separate—将一列分离为多列;

    ctrl+f替换字符,再也不用一个一个改了。

    bar <- ggplot(data = diamonds) + geom_bar( mapping = aes(x = cut, fill = cut), show.legend = FALSE, width = 1 ) + theme(aspect.ratio = 1) + labs(x = NULL, y = NULL) bar + coord_flip() bar + coord_polar()

    前面赋值bar,后面可以直接修改bar,或者可以用代码

    ggplot(data = diamonds) + geom_bar( mapping = aes(x = cut, fill = cut), show.legend = FALSE, width = 1 ) + theme(aspect.ratio = 1) + labs(x = NULL, y = NULL) + coord_flip()

    效果一样。

    第一章ggplot2.png

    相关文章

      网友评论

        本文标题:R数据科学-day1

        本文链接:https://www.haomeiwen.com/subject/eqcfxqtx.html