R 数据处理 ①

作者: 柳叶刀与小鼠标 | 来源:发表于2018-01-18 17:03 被阅读3次

R语言第二章数据处理③删除重复数据
R语言第二章数据处理④数据框排序和重命名
R语言第二章数据处理⑤数据框列的转化和计算
R语言第二章数据处理⑦dplyr包（2）列处理
R语言第二章数据处理⑥dplyr包（1）列选取
R语言第二章数据处理⑨缺失值判断和填充
R语言第二章数据处理⑧数据采样和离散化
R语言第二章数据处理(9)数据合并
R语言第二章数据处理②选择行
D4-R for Data Science

数据采样：

setwd("E:\\Rwork")
set.seed(1234)
index <- sample(1:nrow(iris),10, replace = T)
index
sample_set <- iris[index,]

index <- sample(nrow(iris),0.75*nrow(iris))
sample_set <- iris[index,]

数值离散化


data(iris)
buckets <- 10
maxseplen <- max(iris$Sepal.Length)
minseplen <- min(iris$Sepal.Length)
cutpoints <- seq(minseplen, maxseplen, by = (maxseplen - minseplen ) / buckets )

cutpoints

cutseplen <- cut(iris$Sepal.Length, breaks = cutpoints , include.lowest = TRUE)
newiris <- data.frame(contseplen = iris$Sepal.Length , discseplen = cutseplen)
newiris

数据合并

最常用merge()函数，但是这个函数使用时候这两种情况需要注意：
1、merge(a,b)，纯粹地把两个数据集合在一起，没有沟通a、b数据集的by，这样出现的数据很多，相当于a*b条数据；
2、merge函数是匹配到a,b数据集的并，都有的才匹配出来，如果a、b数据集ID不同，要用all=T（下面有all用法的代码）。

ID<-c(1,2,3,4)  
name<-c("Jim","Tony","Lisa","Tom")  
score<-c(89,22,78,78)  
student1<-data.frame(ID,name)  
student2<-data.frame(ID,score)  
total_student<-merge(student1,student2,by="ID")  #或者rbind()  
total_student

ID<-c(1,2,3)  
name<-c("Jame","Kevin","Sunny")  
student1<-data.frame(ID,name)  
ID<-c(4,5,6)  
name<-c("Sun","Frame","Eric")  
student2<-data.frame(ID,name)  
total<-cbind(student1,student2)  
total

网友评论

本文标题：R 数据处理 ①

本文链接：https://www.haomeiwen.com/subject/lpswoxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

R 数据处理 ①

相关文章

R语言第二章数据处理③删除重复数据

R语言第二章数据处理④数据框排序和重命名

R语言第二章数据处理⑤数据框列的转化和计算

R语言第二章数据处理⑦dplyr包（2）列处理

R语言第二章数据处理⑥dplyr包（1）列选取

R语言第二章数据处理⑨缺失值判断和填充

R语言第二章数据处理⑧数据采样和离散化

R语言第二章数据处理(9)数据合并

R语言第二章数据处理②选择行

D4-R for Data Science

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

R. python新手日记

生信小白成长记