R包是多个函数的集合。学生信,可以用r语言丰富的图表和biocductor的各种生信分析r包。这次以dplyr为例。
一. 安装加载
安装.png
安装2.png
建立一个示例数据(使用内置数据集iris的简化版)
示例数据.png
二. dplyr的5个基础函数
-
mutate(), 新增数列
mutate.png -
select(),按列筛选
(1). 按列号筛选
select 列号.png
(2). 按列名筛选
select 列名.png -
filter()筛选行
filter.png -
arrange(),按某个列或某几列对整个表格进行排序
arrange.png -
summarise():汇总 结合group_by使用实用性更强
summarise.png
三. dplyr两个实用技能
-
%>%管道操作
管道操作.png - count统计某列的unique值
四. dplyr处理关系数据
将2个表进行连接,但是不要引入factor - inner_join 内连,取交集
- left_join 左连
- full_join 全连
- semi_join 半连接
- anti_join 反连接
- 简单合并,bind_rows(两个表格列数相同);bind_cols(两个表格行数相同)
网友评论