美文网首页生信分析
string数据库的使用

string数据库的使用

作者: 小白兔和小毛驴 | 来源:发表于2021-11-27 20:45 被阅读0次

    string数据库的使用

    我们在打开数据库之后,在菜单栏可以看到很多种来进行相互作用关系预测的选项。如果我们有一个目标蛋白,想要查看这个蛋白的可能的相互作用蛋白可以选择Protein by name;如果我们有很多蛋白,想要查看这些蛋白之间的相互作用关系,那就可以选择Multiple proteins

    由于我们在之前的差异表达分析的时候,可以得到很多基因,所以我们这里选择Multiple proteins来进行下一步分析。这里我们需要的输入的就是基因名即可,基因名与基因名之间通过通过换行来间隔。另外需要做的就是选择目标物种,由于我们做的是人的分析,所以选择人即可。

    接下来点击SEARCH即可。这个时候需要注意的是,点击完之后,页面会马上弹出来。但是对于目标蛋白是不是全部都输入全了。我们需要一直往下拉页面,在最下面看到continue这个按钮。点击最下面这个才算是加载完了。

    首先我们看到的分析结果是就是一个相互作用网络的图。对于这个网络,我们可以通过鼠标来拖动每个node。来使得图形更好看一些。这样也可以导出来直接用了。

    图例(legend)

    首先我们可以看到对于结果的注释,里面标注了不同的node和不同的edges代表什么。(如果不知道node和edge是什么

    1. 节点(node)

    图中每个节点表示一个蛋白,由于真核生物的可变剪切和转录后修饰,1个蛋白编码基因可能会产生多个蛋白,这里将由同一个基因产生的不同isoform进行了合并,在节点上标记的字母实际为对应基因的gene symbol。

    图中有些节点内部有螺旋状的结构,这表示该蛋白的三维结构已知,如果未知的话,节点内部为空。

    默认情况下节点的颜色分成红色和白色,红色代表是你的查询蛋白,白色代表与查询蛋白具有相互作用关系的其他蛋白。由于白色不太好看,string会根据与相互作用的score值对颜色进行映射。在Legend页面,可以看到每个蛋白的颜色和对应的score值,示意图如下

    示例

    2. 边(edge)

    节点之间的连线表示两个蛋白之间的相互作用,不同颜色对应不同的相互作用类型,示意如下

    示例

    从图中可以看到,两个蛋白之间的连线不止一条,这表示两个蛋白间存在多种相互作用关系。所有的相互关系中,既有实验验证的,也有数据预测的结果,所以看上去连线很多,非常复杂,这个可以通过结果页面的Settings进行设置,只展示你感兴趣的相互作用类型,示意图如下

    示例

    在Analysis页面,对于蛋白质相互作用网络中的基因,提供了GO和KEGG富集分析的结果,示意如下

    示例

    在Exports页面,可以导出相互作用网络的图片,支持PNG, SVG格式,也可以导出对应的相互作用表格和蛋白序列,注释等信息,示意如下

    示例

    对于一个包含许多节点的蛋白质相互网络,还可以通过Cluster页面来挖掘其中的子网sub network, 或者也可以称之为module, 本质上是对基因进行聚类,属于同一类的基因所构成的相互作用网络就是一个module, 示意如下

    示例

    支持kmeans和MCL聚类,聚类的结果为TSV格式,从中可以看出哪些基因属于同一类。

    STRING数据库提供了下载功能,由于整个数据库非常大,所以可以选择一个物种,然后下载该物种对应的数据,示意如下

    示例

    具体设置可参考以下网址

    https://cloud.tencent.com/developer/article/1437752

    相关文章

      网友评论

        本文标题:string数据库的使用

        本文链接:https://www.haomeiwen.com/subject/crphxrtx.html