美文网首页
2019-01-23

2019-01-23

作者: happyxhz | 来源:发表于2019-01-23 13:49 被阅读0次

流产胚胎绒毛染色体异常检测必要性:
区分是胚胎自发突变还是遗传自父母导致的异常

核型分析 金标准,需要活细胞,分辨率有限 >5Mb
高通量检测
FISH 定向区域,检测位点有限
HLPA
MLPA

2019-03-26
wig 用来存放比对结果的密度
bigwig 压缩的wig文件
常用文件说明:
http://genome.ucsc.edu/FAQ/FAQformat.html

查找数据库的数据库:

http://bigd.big.ac.cn/databasecommons/

图片.png

IGSR: The International Genome Sample Resource

千人基因组计划的数据,只有正常人的DNA测序情况(为了研究孟德尔遗传病)

TCGA: The Cancer Genome Atlas

TCGA是国家癌症研究所(National Cancer Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督的一个项目,旨在应用高通量的基因组分析技术,以帮助人们对癌症有个更好的认知,从而提高对于癌症的预防、诊断和治疗能力。2005年创办的时候主要聚焦在肺癌、脑癌和乳腺癌上,后来不断扩展。

多癌种、多组学、大样本量!!!

  1. DNA Exome
  2. mRNA-seq (Gene expression)
  3. microRNA
  4. DNA methylation
  5. AFFY genotype and DNA copy number
    ...

TCGA的数据收录在GDC(Genomic Data Common Data Portal)中,网站首页截图如下

NCI-TCGA.png
GDC中的数据主要有open和control两种类型(见下图),其中control的数据主要是individually identifiable,需要authorization方可下载。可以用GDC-client批量下载加入到购物车(Cart)中的Manifest文件(txt,该文件每行为一个下载目标的UUID,里面的文件、MD5、文件大小、状态),下载命令
./gdc-client download -m <manifest> -d <outdir>
GDC Data Portal.png

参考资料:
TCGA数据库简介
肿瘤研究不能不知道的TCGA数据库挖掘工具大全,TCGA再也不愁
生信人:简易TCGA下载工具
)

一个系列的,从windows下载RNA表达量文件(Transcriptome profiling,txt文件,open)、到表达量table整合、到差异表达分析。
TCGA数据库的利用(一)—— 数据下载!
TCGA数据库的利用(二)—— 数据处理!
TCGA数据库的利用(三)—做差异分析的三种方法!

下游在线分析:
https://mp.weixin.qq.com/s/k5eRaus1Y8oWUUjyuEztjQ

cbioportal

cBioPortal.png

整合了历年来发表过的TCGA大文章的数据。主页如上图所示~
选择了一个研究点进去的相关信息,有些关于项目统计情况的图表,生存情况、病人情况(年龄、性别、种族balabala)统计、突变基因和CNA基因统计(基因统计有做MutSig求出q-value),右上角可以选择要研究的目标基因,eg.TP53(下图2),里面有关于基因的详细统计情况,变异(OncoKB, cosmic, CIViC)、共表达基因、基因上的癌症位点分布图等等。

hnsc-TCGA.png
TP53.png

cbioPortal还有一个小工具MutationMapper
用来画变异在gene上的分布图

参考资料:

生存分析相关:

总生存(Overall survival,OS)定义为:从随机化开始至(因任何原因)死亡的时间。被认为是肿瘤临床试验中最佳的疗效终点,当患者的生存期能充分时,它通常是首选终点。
无病生存期(Disease-free survival,DFS)定义为:从随机化开始至疾病复发或(因任何原因)死亡之间的时间。DFS 最常用于根治性手术或放疗后的辅助治疗的研究,目前是乳腺癌辅助性激素治疗、结肠癌辅助治疗、以及乳腺癌的辅助化疗的主要审批基础。

TCGA数据库生存分析的网页工具哪家强

GTEx
正常人不同组织的RNA表达情况,

ucsc browser

  • BLAT
  • in-silico PCR 无参基因组,用酶去打断成片段,相近的物种用这个工具预测一下能产生多大长度的片段

washU browser
支持upload data 可获取多个track,支持circos绘图

肿瘤数据挖掘数据库:
数据挖掘必备宝典:肿瘤挖掘

https://cloud.tencent.com/developer/news/336070

ROC 和AUC
http://www.bioinfo-scrounger.com/archives/767
lncRNA

sed -r 's/>.*gene=([a-zA-Z]*).*/>\1/' ecoli.cds > ecoli.cds.rename

相关文章

网友评论

      本文标题:2019-01-23

      本文链接:https://www.haomeiwen.com/subject/hbhjjqtx.html