美文网首页
NO010.20190107.NAR.COSMIC: explo

NO010.20190107.NAR.COSMIC: explo

作者: arookiea | 来源:发表于2019-01-07 10:44 被阅读0次

    原文链接:COSMIC: exploring the world's knowledge of somatic mutations in human cancer
    文献来源:文献Scalable Open Science Approach for Mutation Calling of Tumor Exomes Using Multiple Genomic Pipelines的参考文献之一
    备注:NAR系列文章之一

    概述

    1. COSMIC(癌症体细胞突变目录)是世界上最大也最综合的探索体细胞突变对人类癌症影响的资源;
    2. COSMIC最初是在2004年发表,最初只是收录编码基因的点突变,现在则包含百万级别的覆盖编码区突变、非编码区突变、基因组重排、融合基因、拷贝数变异以及基因表达变异等多种类型的变异;

    收获

    1. 数据库构建部分,作者多次强调“manual curation”,不仅能够获取非常详细(very high detail)的变异位置信息、疾病描述信息以及其他的患者和人群信息(如年龄、种族和治疗方案信息)等,同时还能够提高对系统化方法的质量控制:对于通过程序化的方法获取的诸如基因和核酸的文章及信息,可以通过人工审查的方式发现并过滤有问题的文章和信息。对此,作者给出了一个统计数字:到目前为止审查的25,715篇文章中,有超过30%的文章由于人工审查不通过而没有被数据库所收录;
    2. 除了manual curation的方法获取数据,还提供了一种“semi-automated approach”来获取大量的癌症基因组/外显子组数据集:详细的样本信息和疾病描述信息是通过人工的方式获取的,但是突变的信息,主要是基因组坐标信息是通过一个软件流程(software pipeline)使用Ensembl注释来实现的;
    3. 写关于网站的使用介绍,可以参考本文的相应部分:非常详细;
    4. 本文的特点重在数据库内容,但是文章本身没有涉及太多的技术的部分,基本上全篇都在“陈述”,像是纯粹的文章型论文,很难感受到作者具体做了哪些工作;

    原文摘录

    1. Copy number annotations are split into numeric and descriptive data sets, the former with full details on absolute copy number at each locus, the latter simply annotating regions of ‘gain’ and ‘loss’;
    2. COSMIC is a database system designed to bring together the world’s information on somatic mutations in human cancer into one single system and make it easily explorable.

    相关文章

      网友评论

          本文标题:NO010.20190107.NAR.COSMIC: explo

          本文链接:https://www.haomeiwen.com/subject/tjyyrqtx.html