R语言第二章数据处理③删除重复数据

作者: 柳叶刀与小鼠标 | 来源:发表于2018-12-07 01:33 被阅读116次

R语言第二章数据处理③删除重复数据
R语言第二章数据处理④数据框排序和重命名
R语言第二章数据处理⑤数据框列的转化和计算
R语言第二章数据处理⑦dplyr包（2）列处理
R语言第二章数据处理⑥dplyr包（1）列选取
R语言第二章数据处理⑨缺失值判断和填充
R语言第二章数据处理⑧数据采样和离散化
R语言第二章数据处理(9)数据合并
【R去重】保留第一个重复/去所有的重复
R语言第二章数据处理②选择行

# Remove duplicates based on Sepal.Width columns
my_data[!duplicated(my_data$Sepal.Width), ]
## # A tibble: 23 x 5
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##          <dbl>       <dbl>        <dbl>       <dbl> <fct>  
## 1          5.1         3.5          1.4         0.2 setosa 
## 2          4.9         3            1.4         0.2 setosa 
## 3          4.7         3.2          1.3         0.2 setosa 
## 4          4.6         3.1          1.5         0.2 setosa 
## 5          5           3.6          1.4         0.2 setosa 
## 6          5.4         3.9          1.7         0.4 setosa 
## # ... with 17 more rows

使用dplyr包删除数据框中的重复行
函数distinct（）[dplyr package]可用于仅保留数据帧中的唯一行。如果存在重复行，则仅保留第一行。它是R base函数unique（）的高效版本。

根据所有列删除重复的行（完全一样的观测值）：
my_data %>% distinct()
根据特定列删除重复值
my_data %>% distinct(Sepal.Length, .keep_all = TRUE)
根据多列删除重复值
my_data %>% distinct(Sepal.Length, Petal.Width, .keep_all = TRUE)
选项.kep_all用于保留数据中的所有变量。

总结

根据一个或多个列值删除重复行：my_data％>％dplyr :: distinct（Sepal.Length）
R base函数从向量和数据帧中提取唯一元素：unique(my_data)
R基函数确定重复元素：duplicated(my_data)

R语言第二章数据处理③删除重复数据
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 R语言第二章数据处理③删除重复数据 ======...
R语言第二章数据处理④数据框排序和重命名
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 R语言第二章数据处理③删除重复数据 R语言第二章...
R语言第二章数据处理⑤数据框列的转化和计算
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 R语言第二章数据处理③删除重复数据 R语言第二章...
R语言第二章数据处理⑦dplyr包（2）列处理
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 R语言第二章数据处理③删除重复数据 R语言第二章...
R语言第二章数据处理⑥dplyr包（1）列选取
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 R语言第二章数据处理③删除重复数据 R语言第二章...
R语言第二章数据处理⑨缺失值判断和填充
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 R语言第二章数据处理③删除重复数据 R语言第二章...
R语言第二章数据处理⑧数据采样和离散化
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 R语言第二章数据处理③删除重复数据 R语言第二章...
R语言第二章数据处理(9)数据合并
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 R语言第二章数据处理③删除重复数据 R语言第二章...
【R去重】保留第一个重复/去所有的重复
参考： R语言第二章数据处理③删除重复数据果子学生信 1.保留第一个重复: A,A,B,C --->A,B,C2....
R语言第二章数据处理②选择行
目录 R语言第二章数据处理①选择列 R语言第二章数据处理②选择行 ========================...

R语言第二章数据处理③删除重复数据

目录

R语言第二章数据处理①选择列

R语言第二章数据处理②选择行

R语言第二章数据处理③删除重复数据

这篇主要介绍如何在R中识别和删除重复数据。

主要用的到R base和dplyr函数：

总结

相关文章

R语言第二章数据处理③删除重复数据

R语言第二章数据处理④数据框排序和重命名

R语言第二章数据处理⑤数据框列的转化和计算

R语言第二章数据处理⑦dplyr包（2）列处理

R语言第二章数据处理⑥dplyr包（1）列选取

R语言第二章数据处理⑨缺失值判断和填充

R语言第二章数据处理⑧数据采样和离散化

R语言第二章数据处理(9)数据合并

【R去重】保留第一个重复/去所有的重复

R语言第二章数据处理②选择行

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Cook R

R. python新手日记

R语言从零开始

R数据读取清理

数据-R语言-图表-决策-Linux-Python

R语言

R语言训练

R语言探索