GEO数据库

作者: 数据控的迷妹 | 来源:发表于2020-08-09 22:54 被阅读0次

    GEO数据库是什么?

    1.GEO,全称Gene Expression Omnibus,中文名叫基因表达综合数据库,网址(https://www.ncbi.nlm.nih.gov/geo/),是由美国国立生物技术信息中心于2000年创建并维护至今的高通量量基因表达数据库
    2.GEO是一个国际公共数据库,收录并整理了全球范围内研究工作者上传的微阵列芯片、二代测序及其他形式的高通量基因组数据,并提供免费下载。

    数据组织结构

    1.GEO数据库有GEO DataSets和GEO Profiles两个子数据库构成。两者的区别是前者以数据集为单位,存储同一实验数据;后者以基因为单位,存储基因在数据集中的表达谱。
    2.GEO的数据类型有5种:platform(平台)、samples(样本)、series(系列)、dataset(数据集)、profile(基因表达谱),前四种数据都有GEO专门分配的编号,指向唯一的数据,编号均以GEO缩写“G”+平台缩写+流水号构成:

    • platform:平台编号以“GPL”开头,如GPL16783;
    • samples:样本编号以“GSM”开头,如GSM4567;
    • series:是将构成某个实验的相关样本集中到一个有意义的数据集,包括实验设计、描述、组别、样本等信息以及检测数据文件,以“GSE”开头;
    • dataset、profile:serises数据进一步分析处理成 dataset和profile, dataset即被分析好的series,编号以“GDS”开头; profile则存储一个个基因在DataSet个分组中的表达谱,分配的是流水号,不冠以特定的开头。

    GEO数据库的使用

    1.点击网址进入NCBI数据库(可直接搜索NCBI)
    2.GEO数据库检索页面

    image.png
    注释: 1.下拉菜单栏选择GEO数据库(GEO DataSets 、GEO Profiles) 2.检索栏,可直接输入关键词或运用布尔逻辑运算符检索 3.高级检索 4.输入检索词后点击search

    检索结果解读

    image.png
    image.png

    数据下载

    下载页面

    下载结果是TXT文件,建议用EXCEL打开。如下图:


    image.png

    相关文章

      网友评论

        本文标题:GEO数据库

        本文链接:https://www.haomeiwen.com/subject/uuhrrktx.html