R（tidyverse包）常用操作

作者: 奔跑的Forrest | 来源:发表于2021-10-13 17:59 被阅读0次

R（tidyverse包）常用操作
用dplyr包进行数据清理-mutate()和arrange()
D4-R for Data Science
R tidyverse 学习
tidyverse包简介
R包tidyverse学习
水稻GO分析
R中关于包的操作
小洁详解《R数据科学》--第十三章管道操作
数据处理神器tidyverse（1）dplyr

提取列

对列进行选择 select 函数

提取行

对行进行选择 filter 函数
slice（）：按位置提取行
filter（）：提取符合特定逻辑条件的行。例如，iris％>％filter（Sepal.Length> 6）。
filter_all（），filter_if（）和filter_at（）：过滤变量然后选择行。这些函数复制所有变量或变量选择的逻辑标准。
sample_n（）：随机选择n行
sample_frac（）：随机选择一小部分行
top_n（）：选择变量排序的前n行

根据某一列合并表格

# 保存左侧完整表格
left_join(table1,table2,by="相同的列名") # 两列列名称不同使用(c ("X1"="Y1"))
right_join # 保存右侧
full_join # 取并集
inner_join # 取交集

删除重复行

# 根据所有列删除重复的行（完全一样的观测值）：
my_data %>% distinct()
# 根据特定列删除重复值
my_data %>% distinct(Sepal.Length, .keep_all = TRUE)
# 根据多列删除重复值
my_data %>% distinct(Sepal.Length, Petal.Width, .keep_all = TRUE)
# 选项.kep_all用于保留数据中的所有变量。

根据一个或多个列值删除重复行：my_data％>％dplyr :: distinct（Sepal.Length）
R base函数从向量和数据帧中提取唯一元素：unique(my_data)
R基函数确定重复元素：duplicated(my_data)

对某一列重命名

colnames(表格名称)[列数] <-"重命名"
colnames(gene_raw_express_data)[1] <-"Gene_ID"

网友评论

本文标题：R（tidyverse包）常用操作

本文链接：https://www.haomeiwen.com/subject/gdreoltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

R（tidyverse包）常用操作

提取列

提取行

根据某一列合并表格

删除重复行

对某一列重命名

相关文章

R（tidyverse包）常用操作

用dplyr包进行数据清理-mutate()和arrange()

D4-R for Data Science

R tidyverse 学习

tidyverse包简介

R包tidyverse学习

水稻GO分析

R中关于包的操作

小洁详解《R数据科学》--第十三章管道操作

数据处理神器tidyverse（1）dplyr

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读