资源合集

作者: monkey_study | 来源:发表于2022-04-27 23:27 被阅读0次

好用的资源整合

你从没见过的的TCGA下载工具 - 生信人 (shengxin.ren)

关于TCGA数据下载，我能说的就是这些了-肿瘤信息学-生信技能树 (biotrainee.com)

现在下载TCGA数据也是非常方便，接着是cgdsR和cbioportal-肿瘤信息学-生信技能树 (biotrainee.com)

使用R包cgdsr来下载TCGA的数据 | 生信菜鸟团 (bio-info-trainee.com)

TCGA ID转换

前置基础学习资料

ID转换大全-测序原理-数据格式-数据库-生信技能树 (biotrainee.com)

生信编程直播第8题-几个ID转换咯-生信人必练的200个数据处理任务-生信技能树 (biotrainee.com)

ID转换大全 (qq.com)

正文

TCGA ID 转化的小插曲 (qq.com)

R****包转换

这个方法就比较好理解了，就是利用注释R包中的数据进行ID转化，比如TCGA肯定是用org.Hs.eg.db包了，然后利用 org.Hs.egENSEMBL2EG和 org.Hs.egSYMBOL中的数据；从命名上应该很好理解，前者是ensembl id和gene id的对应关系，后者是gene id和gene symbol的对应关系。最后整理下获得跟上述一样的ensembl id和gene symbol的对应关系。

library(org.Hs.eg.db)
ensembl2gene <- toTable(org.Hs.egENSEMBL2EG)
gene2symbol <- toTable(org.Hs.egSYMBOL)
ensemble2symbol <- merge(ensembl2gene, gene2symbol, by = "gene_id")[2:3]
write.table(ensemble2symbol, file = "ensembl2symbol.txt", sep = "\t", quote = F, row.names = F)

ensembl2symbol.txt文件中有28945个ID对应关系，这比第一种方法获得的结果还多3000多个。。。然后我粗略的检查了下，发现是由于有多个gene id对应到同一个ensembl id上的情况，然后我也有理由相信第一种方法也会有这种情况发生（但是检查了下，第一种方法这种情况比较少，大约只有39个。。）。但是我在ENSEMBL官网查到一般一个ensemble id也只有一个gene Symbol，所以还是由于两者数据库的数据有部分不统一所造成的。

生存分析

生存分析的统计学探究 (qq.com)

肿瘤中lncRNA机制研究的常见思路 (360doc.com)

整整24个！lncRNA科研必备最全数据库收录 (360doc.com)

[图片上传失败...(image-5b8a73-1650040503761)]

数据库

http://www.datjar.com:40013/bt2104/
常用的假设检验方法(U检验、T检验、卡方检验、F检验) - Lxk- - 博客园 (cnblogs.com)
TCGA phenotype各列的含义 - emanlee - 博客园 (cnblogs.com)

网友评论

本文标题：资源合集

本文链接：https://www.haomeiwen.com/subject/rgscertx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

资源合集

数据库

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读