流产胚胎绒毛染色体异常检测必要性:
区分是胚胎自发突变还是遗传自父母导致的异常
核型分析 金标准,需要活细胞,分辨率有限 >5Mb
高通量检测
FISH 定向区域,检测位点有限
HLPA
MLPA
2019-03-26
wig 用来存放比对结果的密度
bigwig 压缩的wig文件
常用文件说明:
http://genome.ucsc.edu/FAQ/FAQformat.html
查找数据库的数据库:
http://bigd.big.ac.cn/databasecommons/
IGSR: The International Genome Sample Resource
千人基因组计划的数据,只有正常人的DNA测序情况(为了研究孟德尔遗传病)
TCGA: The Cancer Genome Atlas
TCGA是国家癌症研究所(National Cancer Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督的一个项目,旨在应用高通量的基因组分析技术,以帮助人们对癌症有个更好的认知,从而提高对于癌症的预防、诊断和治疗能力。2005年创办的时候主要聚焦在肺癌、脑癌和乳腺癌上,后来不断扩展。
多癌种、多组学、大样本量!!!
- DNA Exome
- mRNA-seq (Gene expression)
- microRNA
- DNA methylation
- AFFY genotype and DNA copy number
...
TCGA的数据收录在GDC(Genomic Data Common Data Portal)中,网站首页截图如下
GDC中的数据主要有open和control两种类型(见下图),其中control的数据主要是individually identifiable,需要authorization方可下载。可以用GDC-client批量下载加入到购物车(Cart)中的Manifest文件(txt,该文件每行为一个下载目标的UUID,里面的文件、MD5、文件大小、状态),下载命令
./gdc-client download -m <manifest> -d <outdir>
GDC Data Portal.png
参考资料:
TCGA数据库简介
肿瘤研究不能不知道的TCGA数据库挖掘工具大全,TCGA再也不愁
生信人:简易TCGA下载工具
)
一个系列的,从windows下载RNA表达量文件(Transcriptome profiling,txt文件,open)、到表达量table整合、到差异表达分析。
TCGA数据库的利用(一)—— 数据下载!
TCGA数据库的利用(二)—— 数据处理!
TCGA数据库的利用(三)—做差异分析的三种方法!
下游在线分析:
https://mp.weixin.qq.com/s/k5eRaus1Y8oWUUjyuEztjQ
cbioportal
cBioPortal.png整合了历年来发表过的TCGA大文章的数据。主页如上图所示~
选择了一个研究点进去的相关信息,有些关于项目统计情况的图表,生存情况、病人情况(年龄、性别、种族balabala)统计、突变基因和CNA基因统计(基因统计有做MutSig求出q-value),右上角可以选择要研究的目标基因,eg.TP53(下图2),里面有关于基因的详细统计情况,变异(OncoKB, cosmic, CIViC)、共表达基因、基因上的癌症位点分布图等等。
TP53.png
cbioPortal还有一个小工具MutationMapper
用来画变异在gene上的分布图
参考资料:
生存分析相关:
总生存(Overall survival,OS)定义为:从随机化开始至(因任何原因)死亡的时间。被认为是肿瘤临床试验中最佳的疗效终点,当患者的生存期能充分时,它通常是首选终点。
无病生存期(Disease-free survival,DFS)定义为:从随机化开始至疾病复发或(因任何原因)死亡之间的时间。DFS 最常用于根治性手术或放疗后的辅助治疗的研究,目前是乳腺癌辅助性激素治疗、结肠癌辅助治疗、以及乳腺癌的辅助化疗的主要审批基础。
GTEx
正常人不同组织的RNA表达情况,
ucsc browser
- BLAT
- in-silico PCR 无参基因组,用酶去打断成片段,相近的物种用这个工具预测一下能产生多大长度的片段
washU browser
支持upload data 可获取多个track,支持circos绘图
肿瘤数据挖掘数据库:
数据挖掘必备宝典:肿瘤挖掘
https://cloud.tencent.com/developer/news/336070
ROC 和AUC
http://www.bioinfo-scrounger.com/archives/767
lncRNA
sed -r 's/>.*gene=([a-zA-Z]*).*/>\1/' ecoli.cds > ecoli.cds.rename
网友评论