-
特点
- 其实是几个R包的详尽说明书,教我们如何高效使用它们来处理数据。https://www.tidyverse.org/
-
tidyverse 工具包
-
ggplot2 数据可视化
ggplot2
-
ggplot(data = <DATA>) +
<GEOM_FUNCTION>(
mapping = aes(<MAPPINGS>),
stat = <STAT>,
position = <POSITION>
) +
<COORDINATE_FUNCTION> +
<FACET_FUNCTION>
- 要点是对ggplot2绘图原理的理解,对各个绘图要素的学习
-
dplyr 数据操作
dplyr -
tidyr 数据整形
tidyr -
readr 数据读取
readr -
purrr 函数编程
purrr -
tibble 数据格式
tibble -
stringr 字符操作
stringr -
forcats 因子操作
forcats -
如何温故知识点
- cheatsheets https://www.rstudio.com/resources/cheatsheets/
- readr && tidyr
-
https://github.com/rstudio/cheatsheets/blob/master/data-import.pdf
- 保存数据
- 读取数据
- 分隔符数据
- 非分隔符数据
- 数据类型
- Tibbles数据框
- 数据整形
- 端数据变长数据
- 长数据变端数据
- 缺失值处理
- 扩展数据表格
- 列的拆分
- 列的合并
-
https://github.com/rstudio/cheatsheets/blob/master/data-import.pdf
- dplyr
-
https://github.com/rstudio/cheatsheets/blob/master/data-transformation.pdf
- 统计汇总
- 分组
- 数据操作
- 过滤筛选
- 逻辑符
- 行去重
- 随机选择行
- 按行选择行
- 选前几行
- 过滤筛选
- 数据排序
- 添加行
- 变量数据操作
- 提取列做为矢量
- 选择列做为表格
- 生成新的列
- 对某列进行操作,生成新列
- 生成新列,且只保留它
- 对所有列操作,生成多新列
- 使用apply功能对某列操作,生成新列
- 添加新列
- 对某列进行重命名
- 矢量函数
- offsets类
- 累加合计类
- 排序类
- 数学类
- 大杂烩类
- 统计函数
- 计数类
- 定位类
- 逻辑类
- 位置/顺序类
- 排序类
- SPREAD类
- 行名
- 把行名作为新的列
- 把列作为行名并删除
- 多个表格合并操作
- 合并列
- 按左边为准
- 按右边为准
- 只保留都有的
- 全保留合并
- 合并行
- 提取行
- 合并列
-
https://github.com/rstudio/cheatsheets/blob/master/data-transformation.pdf
- ggplot2
- data.table
- purrr
- strings
- 其他
- https://github.com/rstudio/cheatsheets/blob/master/Machine%20Learning%20Modelling%20in%20R.pdf
- https://github.com/rstudio/cheatsheets/blob/master/base-r.pdf
- https://github.com/rstudio/cheatsheets/blob/master/caret.pdf
- https://github.com/rstudio/cheatsheets/blob/master/cartography.pdf
- https://github.com/rstudio/cheatsheets/blob/master/data-import.pdf
- https://github.com/rstudio/cheatsheets/blob/master/data-transformation.pdf
- https://github.com/rstudio/cheatsheets/blob/master/data-visualization-2.1.pdf
- https://github.com/rstudio/cheatsheets/blob/master/datatable.pdf
- https://github.com/rstudio/cheatsheets/blob/master/eurostat.pdf
- https://github.com/rstudio/cheatsheets/blob/master/leaflet.pdf
- https://github.com/rstudio/cheatsheets/blob/master/lubridate.pdf
- https://github.com/rstudio/cheatsheets/blob/master/mlr.pdf
- https://github.com/rstudio/cheatsheets/blob/master/mosaic.pdf
- https://github.com/rstudio/cheatsheets/blob/master/package-development.pdf
- https://github.com/rstudio/cheatsheets/blob/master/purrr.pdf
- https://github.com/rstudio/cheatsheets/blob/master/quanteda.pdf
- https://github.com/rstudio/cheatsheets/blob/master/randomizr.pdf
- https://github.com/rstudio/cheatsheets/blob/master/rmarkdown-2.0.pdf
- https://github.com/rstudio/cheatsheets/blob/master/rstudio-ide.pdf
- https://github.com/rstudio/cheatsheets/blob/master/shiny.pdf
- https://github.com/rstudio/cheatsheets/blob/master/sjmisc.pdf
- https://github.com/rstudio/cheatsheets/blob/master/sparklyr.pdf
- https://github.com/rstudio/cheatsheets/blob/master/strings.pdf
- https://github.com/rstudio/cheatsheets/blob/master/survminer.pdf
- https://github.com/rstudio/cheatsheets/blob/master/survminer.pdf
- https://github.com/rstudio/cheatsheets/blob/master/syntax.pdf
- https://github.com/rstudio/cheatsheets/blob/master/xplain.pdf
如果实在有需要请给我发邮件:mengyuanshen@126.com;
也可以关注我的公众号:沈梦圆(PandaBiotrainee)
网友评论