R包安装,有多种方法:包括install.package装载和直接下载R包拖进文件夹
dplyr包用法不是很熟悉,重点写一下:
test <- iris[c(1:2,51:52,101:102),]
-
新增一列:mutate(test, new = Sepal.Length * Sepal.Width)
其中new即是新一列数据的名字 -
筛选列的功能感觉不是特别好用,和[,n]用法类似
select(test,c(n,m))或者c(n,m)换成列名也可 -
filter功能蛮好用的,与which的用法类似,但更简单
filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5 ) 和which函数一致,表示且用&
filter(test, Species %in% c("setosa","versicolor")) -
arrange()函数对数据进行排序(是针对某一列的数据,对整个表格改变顺序)
arrange(test, Sepal.Length)默认的是从小到大,如果要变成从大到小换成desc(Sepal.Length)即可 -
%>%管道操作,其实不太明白
-
count(test,Species)统计出现次数
-
连接函数,其实不如用merge函数,但反连接:返回无法与y表匹配的x表的所记录anti_join
anti_join(x = test2, y = test1, by = 'x')
test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40))
网友评论