蛋白质互作网络(PPI)
蛋白质互作网络(Protein-Protein Interaction Networks,PPI)是由蛋白通过彼此之间的相互作用构成,来参与生物信号传递、基因表达调节、能量和物质代谢及细胞周期调控等生命过程的各个环节。系统分析大量蛋白在生物系统中的相互作用关系,对了解生物系统中蛋白质的工作原理,了解疾病等特殊生理状态下生物信号和能量物质代谢的反应机制,以及了解蛋白之间的功能联系都有重要意义。
STRING数据库介绍
STRING数据库是一个搜索已知蛋白质之间和预测蛋白质之间相互作用的数据库,该数据库可应用于2031个物种,包含960万种蛋白和1380万中蛋白质之间的相互作用。它除了包含有实验数据、从PubMed摘要中文本挖掘的结果和综合其他数据库数据外,还有利用生物信息学的方法预测的结果。
研究蛋白之间的相互作用网络,有助于挖掘核心的调控基因,目前已经有很多的蛋白质相互作用的数据库,而STRING是其中覆盖的物种最多,相互作用信息最大的一个。目前最新版本为2019年1月19日发布的String 11.0。
STRING 使用弹簧模型来生成网络图像。节点被模拟为弹簧的质量和连线;通过最小化系统的“能量”来计算图像中节点的最终位置。首先,图中连线的两个节点间的物理距离没有意义。其次,虽然算法是确定的,但是新的节点添加到网络会导致新图像中节点位置完全改变。
STRING网站的使用
(1)界面是这样的
如果我们输入的是单个蛋白质名称,数据库将会输出与该蛋白质互作的所有蛋白质的互作图;如果我们一次输入多个蛋白质名称或者序列,数据库将只输出输入蛋白质之间的互作网络图。
例如:输入单个基因名称:mxt (Drosophila melanogaster)
点击节点和连线会给出蛋白质详情和证据详情。
(2)节点和边
(3)选项
String 11.0
Legend
节点和边的样式和含义
Settings
「meaning of network edges」:1)证据:其中颜色表示交互证据的类型;2)置信线厚度表示数据支持的强度;3)分子作用线形状表示预测的作用模式。
「active interaction sources」:可以选择哪种类型的证据将有助于预测分数。
「minimum required interaction score」:将置信度得分设置为阈值,使得只有大于该分的关系才包括在蛋白网络中。较低的分数意味着更多的互动,更多的假阳性。
「network display mode」:1)静态图像:图像是一个简单位图图像;2)交互式 svg:图像是一个可扩展的矢量图形;3)交互式闪存:蛋白网络显示在 Flash 程序中,可实现更多功能(如,聚类)。
Analysis
给出了蛋白网络的简要统计,如节点数和边数。平均节点度是蛋白质在网络中平均有多少相互作用。聚类系数是网络节点连接的度量。在Analysis可对网络进行功能富集,包括Biological Process (GO)、Molecular Function
(GO)、Cellular Component (GO)、KEGG Pathways与Reactome
Pathways等。
Exports
可导出PNG和SVG格式的网络图。如果想自己用Cytoscape调,也可以将蛋白网络导出为TSV,可以用Excel打开,其中包括节点信息、node1_string_internal_id与combined_score等诸多信息。
位图:PNG 文件格式的网络图像。
高分辨率位图:PNG格式的图像,分辨率为400 dpi。
矢量图形:可以在Illustrator、CorelDraw、Dia等中打开和编辑的SVG格式图像。
表格文本: TSV 格式的数据。可以在 Excel 中打开。(…as simple tabular text output)
XML 摘要:结构化XML格式的数据。
网络坐标:描述网络中节点坐标和颜色的平面文件格式。
蛋白质序列 - MFA:多基因格式,含有网络中的氨基酸序列。
蛋白质注释:制表符分隔的文件,描述网络蛋白质的名称,结构域和功能。
Clusters
将PPI网络进行聚类。蛋白通过聚类形成不同颜色的成簇分布的蛋白互作网络图。
More/Less
点击上图More可以得到更复杂的网络,同理点击Less会使网络节点减少。
(4)STRING得到的TSV文件,导入Cytoscape:Import Networks from File System
网友评论