美文网首页
R读入大文件

R读入大文件

作者: KK_f2d5 | 来源:发表于2019-04-03 14:29 被阅读0次

在建立好了模型后,需要倒入实际运用数据来操作。
把很大,甚至几个G的文件导入到R是一个问题。
尝试使用read.table(),snp位点太多,即使很少个体也需要很长时间,并且内存不够。所以我们删除raw文件的前六列,只保留geno文件,以matrix形式读入。
我们可以采用:

awk '{for(i=7;i<NF;i++)printf("%s ",$i);print $NF}' new-small.raw>new-small-geno.raw
wc -l new-small-geno.raw 
awk '{print NF}' new-small-geno.raw #列数
sed -i "" '1d' new-small-geno.raw #mac上操作需要""
smasnp<-matrix(scan(file="new-small-geno.raw",what=integer(),sep="\t",na.strings = "NA"),12,784256)#R

那真是速度相当快

相关文章

网友评论

      本文标题:R读入大文件

      本文链接:https://www.haomeiwen.com/subject/gkfzbqtx.html