1. 概述
- 和 TCGA 紧密相关的数据库
- GTEx:正常人对照
- CCLE:肿瘤细胞系对照
- 学习一个网页工具的使用:找到使用该工具的文章/官方教学视频
2. 网页工具
2.1. 思路
- 有感兴趣的基因用 Xena
- 想知道哪些基因可能重要用 firehose
2.2. UCSC Xena
- 局限性:只能看某几个基因
- 筛选功能
- 可以可视化看生存情况、两种数据的相关性等
- 可以通过 pan-cancer study 来看多种癌症
- 下载最新数据比 R 包方便
2.3. firehose
- 其数据可以作为 Xena 的补充
- 某种癌症的全部分析可视化
- homepage
- 进入 iCoMut Beta for FireBrowse
- 某种癌症的全部分析结果
- homepage - 右侧选择一种癌症
-
进入 Analysis Overview
- 选择一种相关性的报告,即可找到该种相关性最显著的基因
3. 数据下载
- GDC
- firehose
- Xena
- 还有很多
4. 数据挖掘的思路
4.1. signature
- mRNA, miRNA, lncRNA, mRNA-lncRNA, miRNA-lncRNA, miRNA-mRNA, CpG, CNV, SNV, fusion events, alternative splicing
- 训练集、测试集
- 两个合在一起的signature是怎么做的?
4.2. WGCNA, LASSO, COX
- WGCNA,LASSO 的代码实现
4.3. ceRNA
5. 小知识
- R 中列出某目录下符合条件的文件:
list.files(
path='...', # 在哪个目录下找
pattern='*.xml$', # 正则
recursive=T # 该目录下文件夹里的文件也在搜索范围内
)
友情宣传
-
全国巡讲全球听(买一得五),第二期 ,你的生物信息学入门课
-
生信技能树的2019年终总结 ,你的生物信息学成长宝藏
网友评论