学习R包
一、安装并加载R包
下载R包,不同的电脑可能不不一样镜像设置-安装-加载(其中镜像设置我好像没有用上,直接就输入下载的就下载成功了)
我首先是傻傻的什么内容都不告诉人家下载什么

后来知道肯定要把包的名字写进去,然后就开始下载了

加载的话是下面这样子,后面还跟了一段话

二 、dplyr函数的操作
首先test <- iris[c(1:2,51:52,101:102),]
给test赋值iris包的1、2、51、52、101、102行的数据
1. mutate()添加新变量并保留现有变量; transmute()添加新变量,并删除现有变量。
mutate(.data, 列名=数据)
test<-iris[c(1:2,51:52,101:102),]
mutate(test,new = Sepal.Length * Sepal.Width)
i
2. select(),按列筛选
select(data,筛选内容),可以按列名,按列数
select(test,c(1:5))

3. filter()筛选行,可以按行名,按行数,还可以筛选特殊字符
select(test,1)
. select(test,c(1,5))

在test中选择存在“setosa”的行,并且Sepal.Length>5的行
filter(test,Species=="setosa"&Sepal.Length>5)

4.arrange(),按某1列或某几列对整个表格进行排序
arrange(test, Petal.Length)#默认从小到大排序

arrange(test, desc(Petal.Length))#用desc从大到小
5.summarise():汇总
对数据进行汇总操作,summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
计算每组Sepal.Length的平均值和标准差

6.管道操作%>%(cmd/ctr+shift+M)
计算机中的管道,就是一种解决进程间信息交互问题的手段。

7.count统计某列的各个元素的个数

三 、dplyr处理关系数据
内联,取交集 这里的交集是"bef"
inner_join()

左连
left_join()
结果会根据括号里前后文件的不一样有区别

全连
full_join()
最后的by="x",的引号部分单双额

半链接
semi_join()

简单合并
相当于base包里的cbind()函数和rbind()函数
bind_rows()
需要两个表格列数相同
bind_cols()
需要两个数据框有相同的行数

今天不仅学会了关于dplyr函数的运用,还把之前一直不会在markdown里展示的代码弄上了,也调整了图片的大小,这样看起来我的笔记应该就会好看了很多。
该笔记借鉴了“黑森林深处的小星星”的部分,小星星同学的学习笔记写的很好,值得我学习借鉴!
网友评论