美文网首页
R(tidyverse包)常用操作

R(tidyverse包)常用操作

作者: 奔跑的Forrest | 来源:发表于2021-10-13 17:59 被阅读0次
提取列

对列进行选择 select 函数

提取行

对行进行选择 filter 函数
slice():按位置提取行
filter():提取符合特定逻辑条件的行。 例如,iris%>%filter(Sepal.Length> 6)。
filter_all(),filter_if()和filter_at():过滤变量然后选择行。 这些函数复制所有变量或变量选择的逻辑标准。
sample_n():随机选择n行
sample_frac():随机选择一小部分行
top_n():选择变量排序的前n行

根据某一列合并表格
# 保存左侧完整表格
left_join(table1,table2,by="相同的列名") # 两列列名称不同使用(c ("X1"="Y1"))
right_join # 保存右侧
full_join # 取并集
inner_join # 取交集
删除重复行
# 根据所有列删除重复的行(完全一样的观测值):
my_data %>% distinct()
# 根据特定列删除重复值
my_data %>% distinct(Sepal.Length, .keep_all = TRUE)
# 根据多列删除重复值
my_data %>% distinct(Sepal.Length, Petal.Width, .keep_all = TRUE)
# 选项.kep_all用于保留数据中的所有变量。

根据一个或多个列值删除重复行:my_data%>%dplyr :: distinct(Sepal.Length)
R base函数从向量和数据帧中提取唯一元素:unique(my_data)
R基函数确定重复元素:duplicated(my_data)

对某一列重命名
colnames(表格名称)[列数] <-"重命名"
colnames(gene_raw_express_data)[1] <-"Gene_ID"

相关文章

网友评论

      本文标题:R(tidyverse包)常用操作

      本文链接:https://www.haomeiwen.com/subject/gdreoltx.html