美文网首页
GEO数据库覆盖的生物种数统计方法

GEO数据库覆盖的生物种数统计方法

作者: 小洁忘了怎么分身 | 来源:发表于2019-02-12 13:59 被阅读18次

"迄今为止,GE0已包含300,000个样本的数据,涉及16亿个基因表达丰度数据,涵盖500多种生物,涵盖广泛的生物学内容。 "
生物种数统计方法:
https://www.ncbi.nlm.nih.gov/geo/browse/?view=platforms


找到平台信息,点击emport,一次只能下5000条,所以分4次下完

p1 <- read.csv('platform.csv')
p2 <- read.csv('platform (1).csv')
p3 <- read.csv('platform (2).csv')
p4 <- read.csv('platform (3).csv')
p <- rbind(p1,p2,p3,p4)
colnames(p)
library(tidyverse)
co <- count(p,Taxonomy,sort=T)
#还可以统计sample和series,不过这个在首页上就有。
sum(p$Samples.Count)
sum(p$Series.Count)
就是这样

相关文章

网友评论

      本文标题:GEO数据库覆盖的生物种数统计方法

      本文链接:https://www.haomeiwen.com/subject/yufceqtx.html