美文网首页
2019-01-23

2019-01-23

作者: happyxhz | 来源:发表于2019-01-23 13:49 被阅读0次

    流产胚胎绒毛染色体异常检测必要性:
    区分是胚胎自发突变还是遗传自父母导致的异常

    核型分析 金标准,需要活细胞,分辨率有限 >5Mb
    高通量检测
    FISH 定向区域,检测位点有限
    HLPA
    MLPA

    2019-03-26
    wig 用来存放比对结果的密度
    bigwig 压缩的wig文件
    常用文件说明:
    http://genome.ucsc.edu/FAQ/FAQformat.html

    查找数据库的数据库:

    http://bigd.big.ac.cn/databasecommons/

    图片.png

    IGSR: The International Genome Sample Resource

    千人基因组计划的数据,只有正常人的DNA测序情况(为了研究孟德尔遗传病)

    TCGA: The Cancer Genome Atlas

    TCGA是国家癌症研究所(National Cancer Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督的一个项目,旨在应用高通量的基因组分析技术,以帮助人们对癌症有个更好的认知,从而提高对于癌症的预防、诊断和治疗能力。2005年创办的时候主要聚焦在肺癌、脑癌和乳腺癌上,后来不断扩展。

    多癌种、多组学、大样本量!!!

    1. DNA Exome
    2. mRNA-seq (Gene expression)
    3. microRNA
    4. DNA methylation
    5. AFFY genotype and DNA copy number
      ...

    TCGA的数据收录在GDC(Genomic Data Common Data Portal)中,网站首页截图如下

    NCI-TCGA.png
    GDC中的数据主要有open和control两种类型(见下图),其中control的数据主要是individually identifiable,需要authorization方可下载。可以用GDC-client批量下载加入到购物车(Cart)中的Manifest文件(txt,该文件每行为一个下载目标的UUID,里面的文件、MD5、文件大小、状态),下载命令
    ./gdc-client download -m <manifest> -d <outdir>
    
    GDC Data Portal.png

    参考资料:
    TCGA数据库简介
    肿瘤研究不能不知道的TCGA数据库挖掘工具大全,TCGA再也不愁
    生信人:简易TCGA下载工具
    )

    一个系列的,从windows下载RNA表达量文件(Transcriptome profiling,txt文件,open)、到表达量table整合、到差异表达分析。
    TCGA数据库的利用(一)—— 数据下载!
    TCGA数据库的利用(二)—— 数据处理!
    TCGA数据库的利用(三)—做差异分析的三种方法!

    下游在线分析:
    https://mp.weixin.qq.com/s/k5eRaus1Y8oWUUjyuEztjQ

    cbioportal

    cBioPortal.png

    整合了历年来发表过的TCGA大文章的数据。主页如上图所示~
    选择了一个研究点进去的相关信息,有些关于项目统计情况的图表,生存情况、病人情况(年龄、性别、种族balabala)统计、突变基因和CNA基因统计(基因统计有做MutSig求出q-value),右上角可以选择要研究的目标基因,eg.TP53(下图2),里面有关于基因的详细统计情况,变异(OncoKB, cosmic, CIViC)、共表达基因、基因上的癌症位点分布图等等。

    hnsc-TCGA.png
    TP53.png

    cbioPortal还有一个小工具MutationMapper
    用来画变异在gene上的分布图

    参考资料:

    生存分析相关:

    总生存(Overall survival,OS)定义为:从随机化开始至(因任何原因)死亡的时间。被认为是肿瘤临床试验中最佳的疗效终点,当患者的生存期能充分时,它通常是首选终点。
    无病生存期(Disease-free survival,DFS)定义为:从随机化开始至疾病复发或(因任何原因)死亡之间的时间。DFS 最常用于根治性手术或放疗后的辅助治疗的研究,目前是乳腺癌辅助性激素治疗、结肠癌辅助治疗、以及乳腺癌的辅助化疗的主要审批基础。

    TCGA数据库生存分析的网页工具哪家强

    GTEx
    正常人不同组织的RNA表达情况,

    ucsc browser

    • BLAT
    • in-silico PCR 无参基因组,用酶去打断成片段,相近的物种用这个工具预测一下能产生多大长度的片段

    washU browser
    支持upload data 可获取多个track,支持circos绘图

    肿瘤数据挖掘数据库:
    数据挖掘必备宝典:肿瘤挖掘

    https://cloud.tencent.com/developer/news/336070

    ROC 和AUC
    http://www.bioinfo-scrounger.com/archives/767
    lncRNA

    sed -r 's/>.*gene=([a-zA-Z]*).*/>\1/' ecoli.cds > ecoli.cds.rename

    相关文章

      网友评论

          本文标题:2019-01-23

          本文链接:https://www.haomeiwen.com/subject/hbhjjqtx.html