美文网首页miRNA
GEO数据库中platform信息详解

GEO数据库中platform信息详解

作者: 生信修炼手册 | 来源:发表于2019-01-14 11:05 被阅读60次

    欢迎关注”生信修炼手册”!

    GEO数据库中的platform代表测序平台或者芯片平台,每一个platform用GPL开头的编号唯一标识。对于一个platform而言,通常包含以下3种文件

    1. soft

    2. miniml

    3. suppl

    GPL20814为例,链接如下

    https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL20814

    softminiml都是表示该platform的基础信息,比如GPL编号,上传日期等,soft文件的部分内容如下

    ^DATABASE = GeoMiame
    !Database_name = Gene Expression Omnibus (GEO)
    !Database_institute = NCBI NLM NIH
    !Database_web_link = http://www.ncbi.nlm.nih.gov/geo
    !Database_email = geo@ncbi.nlm.nih.gov
    ^PLATFORM = GPL20814
    !Platform_title = Human miRNA Array miRbase release 19
    !Platform_geo_accession = GPL20814
    !Platform_status = Public on Jun 12 2017
    !Platform_submission_date = Aug 18 2015
    !Platform_last_update_date = Jun 12 2017

    soft文件中,每种类别的信息以^开头,常见的类别如下所示

    1. DATABASE

    2. PLATFORM

    3. SAMPLE

    4. SERIES

    DATABASE代表GEO数据库的基本信息,PLATFORM代表该平台的基本信息,SAMPLE代表用该平台得到的样本信息,SERIES代表使用该平台得到的一组样本。

    在每种类别中,!开头代表一种类型的信息,常规格式为key = value, 比如

    Platform_geo_accession = GPL20814

    对于芯片平台而言,还会提供探针和基因之间的对应关系等信息,在对应的网页上,我们可以看到如下的表格

    这部分内容在soft文件中也是存在的,示意如下

    !platform_table_begin
    ID    Reporter Name    miRNA_ID    SPOT_ID
    272    hsa-miR-99b-5p    MIMAT0000689    
    271    hsa-miR-99b-3p    MIMAT0004678    
    270    hsa-miR-99a-5p    MIMAT0000097    
    269    hsa-miR-99a-3p    MIMAT0004511    
    268    hsa-miR-98-5p    MIMAT0000096
    ...
    !platform_table_end

    采用配对的两个!叹号来表示数据的开始和结束,在中间存放对应的表格数据。

    miniml中的内容和soft是一样的,只是用XML格式来存储上述信息,而supplement file则是由提交者自己上传的一些补充文件,没有明确的格式。

    ·end·

    —如果喜欢,快分享给你的朋友们吧—

    扫描关注微信号,更多精彩内容等着你!

    相关文章

      网友评论

        本文标题:GEO数据库中platform信息详解

        本文链接:https://www.haomeiwen.com/subject/cqdddqtx.html