美文网首页生信在线数据库转录组数据分析
MINT:蛋白质相互作用数据库简介

MINT:蛋白质相互作用数据库简介

作者: 生信修炼手册 | 来源:发表于2018-11-23 16:56 被阅读7次

    欢迎关注”生信修炼手册”!

    MINT, 全称molecular interaction Database, 是一个蛋白质相互作用的数据库,该数据库中的蛋白相互作用都是由专家审核过的有实验证据支持的,目前该数据库涵盖了607个物种,共117001个蛋白相互作用关系。网址如下

    https://mint.bio.uniroma2.it/

    目前该数据库中的数据已经集成到intact这个数据库中去了,所以官网上只提供了下载功能,示意如下


    既可以一次下载整个数据库中的所有内容,也可以只下载常见物种的数据。下载的文件格式称之MITAB格式,这种格式是\t分隔的纯文本文件,专门用来描述两个蛋白间的相互作用。

    对于蛋白A和蛋白B, 如果二者存在相互作用,就说存在一个interaction, 而蛋白A和B称之为interactors, 在MITAB格式的文件中,除了记录interaction 之外,还记录了interactors的诸多属性。该文件列数很多,下面对前15列信息进行说明

    1. column1

    第一列记录的信息为Unique identifier for interactor A, 代表蛋白A的唯一标识符,在MINT数据库中,采用的是uniprot数据库中的蛋白编号,比如uniprotkb:Q4ZGA4

    2. column2

    第二列记录的信息为Unique identifier for interactor B, 和第一列的内容类似,用来记录蛋白B的唯一标识符

    3. column3

    第三列记录的信息为Alternative identifier for interactor A, 代表蛋白A的其他标识符,比如在intact数据库中的蛋白编号intact:EBI-9675545, 在MINT数据库中的蛋白编号intact:MINT-1525738, 或者是在uniprot数据库中的别名,比如uniprotkb:A0SDZ7, 多个标识符用|连接

    4. column4

    第四列记录的信息为Alternative identifier for interactor B,和第三列类似,用来记录蛋白B的其他标识符

    5. column5

    第五列记录的信息为Aliases for A, 代表其他数据库中的名字,格式为databaseName:name(alias type), 比如对应的基因名称uniprotkb:HBZ(gene name), 多个别名用|连接

    6. column6

    第六列记录的信息为Aliases for B, 和第五列类似,用来记录蛋白B的别名

    7. column7

    第七列记录的信息为Interaction detection methods,代表蛋白相互作用检测的方法,格式为databaseName:identifier(methodName),比如psi-mi:”MI:0096”(pull down)

    8. column8

    第八列记录的信息为First author,代表记录该蛋白相互作用的文献的第一作者

    9. column9

    第九列记录的信息为Identifier of the publication,代表对应文献的标识符,比如pubmed:22458338

    10. column10

    第十列记录的信息为NCBI Taxonomy identifier for interactor A, 代表蛋白A对应物种的tax id,比如human为taxid:9606(human)|taxid:9606(Homo sapiens)

    11. column11

    第十一列记录的信息为NCBI Taxonomy identifier for interactor B,和第十列类似,用来记录蛋白B对应的物种

    12. column12

    第十二列记录的信息为Interaction types,代表相互作用的类型,格式为dataBaseName:identifier(interactionType),比如psi-mi:"MI:0915"(physical association)

    13. column13

    第十三列记录的信息为Source databases,代表该相互作用来源的数据库,比如psi-mi:"MI:0471"(MINT)

    14. column14

    第十四列记录的信息为Interaction identifiers,代表相互作用的标识符,比如在intac数据库中的标识符intact:EBI-7355797, 在MINT数据库中的标识符mint:MINT-68665, 多个数据库中的标识符用|连接。

    15. column15

    第十五列记录的信息为Confidence score,代表相互作用结果的打分值,比如intact-miscore:0.52, 不同的实验证据其强度不同,通过打分值来衡量相互作用的可靠程度

    除此之外,该文件中还可以包含很多其他列的信息,具体的解释可以参考以下链接

    https://psicquic.github.io/MITAB28Format.html


    蛋白质相互作用的研究是非常重要的,所以关于蛋白质相互作用的信息如何表示和存储,专门有团队研究和制订了特定的文件格式,并且规定了各种鉴定方法和相互作用类型对应的专有名词,详细信息见如下链接

    https://www.ebi.ac.uk/ols/ontologies/mi

    ·end·

    —如果喜欢,快分享给你的朋友们吧—

    扫描关注微信号,更多精彩内容等着你!

    相关文章

      网友评论

        本文标题:MINT:蛋白质相互作用数据库简介

        本文链接:https://www.haomeiwen.com/subject/cbajqqtx.html