美文网首页
2021-07-01

2021-07-01

作者: wangyantao1991 | 来源:发表于2021-07-01 19:38 被阅读0次

    昨天忙着做实验,没时间鼓捣数据,今天也得做实验,不过在试验开始之前还是先整理一下吧:

    首先是安装R包

    尝试本地运行后发现,报错:

    本地内存太小,程序无法运行。

    到集群上运行,使用大神的R软件,修改.bashrc,添加R软件的调用路径。

    export PATH=/public/home/liuxiaofeng/miniconda3/envs/R.4/bin:$PATH

    export R_LIBS=/public/home/liuxiaofeng/R/x86_64-conda_cos6-linux-gnu-library/4.0

    启动R软件,运行如下脚本:

    library(org.Hs.eg.db)

    swiss_id <- read.delim('/vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_go.sae1',header = F)

    colnames(swiss_id) <- c('gene_id','GO')

    ev_id <- select(org.Hs.eg.db,keys = as.vector(swiss_id$GO),columns = c('EVIDENCE'),keytype = "GO")

    library(dplyr)

    swiss_goev <- left_join(swiss_id,ev_id[,1:2])

    write.csv(swiss_goev,'/vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_goev_sea.csv',row.names = F,quote = F)

    生成的结果文件竟然足足有28.7个GB,额度个娘嘞。

    内存太小了,根本跑不起来。。。

    继续搞其他的:

    相关文章

      网友评论

          本文标题:2021-07-01

          本文链接:https://www.haomeiwen.com/subject/anfjultx.html