学习小组D6-lz

作者: 明眸意海 | 来源:发表于2020-04-04 13:17 被阅读0次

    R包学习

    • 安装 install.packages(“包的名称”) CRAN的包或,BiocManager::install(“包的名称”) ,Biocductor的包
    • 加载: library(), require()
    • 镜像配置 :
    options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
    options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
    

    dplyr package 学习

    • mutate(数据集,新的一列列名=。。。),新增列
    • select(数据集,X),按列筛选:1.按列号筛选 2 按列名筛选
    • filter(数据集,筛选条件):筛选行
    • arrange():按某1列或某几列对整个表格进行排序,默认从小到达,可用de
    • summarise():汇总,常跟分组函数group_by 联用
    • 管道操作 %>% (cmd/ctr + shift + M)
    • count:统计某列的各变量出现次数

    dplyr处理关系数据

    • 內连inner_join(data1,data2,by=共有列名"),取交集
    • 左连left_join 第一个data 全保留,保留data2中与data1的交集,其余自动NA填充
    • 全连full_join :并集
    • 半连接semi_join:返回能够与y表匹配的x表所有记录,即取交集后只保留x的相关信息
    • 反连接anti_join:返回无法与y表匹配的x表的所记录(有点拗口,自己去R敲一下代码加深理解吧。。O(∩_∩)O)
    • 简单合并:相当于base包里的cbind()函数和rbind()函数;
      注意:bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数

    相关文章

      网友评论

        本文标题:学习小组D6-lz

        本文链接:https://www.haomeiwen.com/subject/kyadphtx.html