美文网首页
VIRGO 和 VOG 数据库使用教程(1)

VIRGO 和 VOG 数据库使用教程(1)

作者: 不愧是你_a | 来源:发表于2022-02-17 20:17 被阅读0次

    VIRGO网站:https://virgo.igs.umaryland.edu/
    VIRGO 是人类阴道微生物群落的非冗余基因目录。它是用宏基因组和尿源分离基因组序列的组合构建的。VIRGO可以用来描述阴道宏基因组和宏转录组数据集的分类和功能组成。可用的功能注释包括:KEGG、COG、eggNOG、CDD、GO、Pfam、TIGRfam、EC number。

    VOG 是由一种新的jaccard聚类方法定义的阴道微生物群同源基因的集合,该氨基酸序列互补数据库可用于阴道同源蛋白家族的功能注释、比较基因组学和进化。

    1.依赖的工具:

    BLAST 2.2.3+
    Bowtie 1.1.2+
    GNU Awk 3.1+
    seqtk 1.0+

    2.数据库结构:

    testrun:包含测试数据集和结果

    0_db:包含可搜索的数据库文件和序列

    VIRGO Bowtie 1 database
    VIRGO Bowtie 2 database
    VIRGO BLASTN database
    VIRGO BLASTP database

    1_VIRGO :包含了基因的注释文件

    0.geneLength 包含bp基因长度
    1.taxon.table 包含分类信息
    2.A.proteinFamily.txt 包含来自17个源的注释,每行一个源
    2.B.proteinFamily.txt 包含来自17个源的注释,每行一个基因
    3.eggnog.txt 包含 eggNOG 注释
    4.GC.txt 包含高或低基因计数信息,指示基因是否对高或低基因计数群体有偏好(>95%)
    5.EC.txt 包含酶学委员会编号(EC 编号)
    6.product.txt 包含基因产物注释
    7.rxn.txt 包含 KEGG 反应注释
    8.A.kegg.ortholog.txt 包含 KEGG 直向同源注释
    8.B.kegg.module.txt 包含 KEGG 模块注释
    8.C.kegg.pathway.txt 包含 KEGG 通路注释

    2_VOG_annotation :包含 VOG 序列和 VIRGO 基因的链接器文件

    0.VOG.VIRGO.tbl.txt:链接 VIRGO 和 VOG 的id
    1.VOG.size.txt:VOG蛋白家族的大小
    2.VOG.GC.txt:基因计数注释
    3.VOG.funcat.txt:eggNOG 功能类
    4.VOG.taxonomy.txt:共识分类法
    5.VOG.alignmentScore.txt:蛋白质家族的比对分数

    3_fungal_phage:包含10908个真菌和15965个噬菌体基因的注释

    4_run_VIRGO:包含用于分析宏基因组和元转录组数据集的脚本

    5_Jaccard_index_clustering:包含用于执行 jaccard 聚类以识别 VOG 的脚本

    相关文章

      网友评论

          本文标题:VIRGO 和 VOG 数据库使用教程(1)

          本文链接:https://www.haomeiwen.com/subject/ovenkrtx.html