[文献阅读]Correlation of Somatic Mut

作者: 郑宝童 | 来源:发表于2019-06-21 16:31 被阅读14次

    Correlation of Somatic Mutation and Expression Identifies Genes Important in Human Glioblastoma Progression and Survival
    利用体细胞突变和表达的相关性来确定在人胶质母细胞瘤进展和生存中重要的基因

    文章主题部分主要用了一个巧妙的方法来识别与某突变基因显著相关的表达基因,最后分析一些重要突变基因的互斥状态。

    文章开发了一种自动化的、无模型的方法来快速和详尽地检查体细胞突变和基因表达之间的相关性,并从TCGA中查询149个GBM肿瘤样本。该方法鉴定了41个基因,其突变状态与其他基因在肿瘤样本中的表达的剧烈变化高度相关。41个基因中的一些以前与GBM发病机制有关(如NF1、TP53、RB1和IDH1),而其他与癌症有关的基因以前在使用TCGA数据(如Syne1、KLF6、FGFR4和EPHB4)的研究中没有被强调。该方法还预测已知的癌基因和肿瘤抑制因子分别通过剧烈的过度表达和低表达参与GBM。此外,该方法还鉴定了TP53和PLK1之间已知的合成致死相互作用、与TP53的其他潜在合成致死相互作用以及IDH1突变状态与已知GBM生存基因过度表达之间的相关性。(你可能会问41个基因从哪来的?All mutations labeled Validated and Nonsilent, and Somatic or LOH were used. There were a total of 583 genes,基因从上面英文所述的地方来的,共583个小时基因,卡突变发生在2个样本以上,583基因被缩减到307基因,跑完流程B只剩下41个基因了,然后文章就就针对这41个基因进行一段文本挖掘,41个基因的一些基因的合成致死等问题。)

    文章流程图如下:


    流程
    最后
    • A 取得突变数据和表达数据共有的样本,A中的两个数据就是同样本的表达和突变数据
    • B: 以每一个突变基因的01状态作为类标签,针对表达数据做SAM差异分析,获得与突变状态有关的差异基因
    • C:将差异基因对应的表达谱按行转换成z-score谱,对与差异上调基因,我们把z>2的打上标签1,差异下调基因,把z<-2打上标签1,这些1代表的是差异基因在相应样本中显著的高表达或低表达。
    • D: 把突变标签和新得到的01标签结合起来做fisher,用于判断这个突变基因与,差异基因的高低表达是否显著相关
    • E:将与某突变显著相关的基因拿出来,对表达做heatmap
    • 循环对每一个突变基因执行B-E过程
    • F:对B-E获取的显著基因,进行文本挖掘和网络分析
    • 上述循环过程执行完,文章的案例数据就只剩下41个基因,最后文章着重分析这是41个基因中的互斥状态以及生存相关的问题

    相关文章

      网友评论

        本文标题:[文献阅读]Correlation of Somatic Mut

        本文链接:https://www.haomeiwen.com/subject/zftuqctx.html