先来给大家介绍下PROSITE这个网站吧。下面是百度百科的介绍:
PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
OK,下面咱们进入正题,举例来看看如何使用PROSITE来帮助大家寻找具备相同结构功能域的基因。
番茄里面哪些基因含有jmjc这个结构域。
1. 首先我们进入uniprot搜索jmjc然后我们可以选择一个在人里面的jmjc基因JMJD1C,进入查看jmjc domain的信息。
image2. 进入JMJD1C即Q15652
image下拉到Family & Domains信息框。这里提供了与其他蛋白质的相似性序列和蛋白质中存在的结构域的信息。包含Domain、Repeat、Motif、Sequence similarities等信息。
image在这里我们可以看到含有这个基因含有一个JmjC结构域和LXXLL motif。其中JmjC结构域可以在PROSITE里面查到相关信息,点击PROSITE-ProRule进入查看详细信息。
image这就是PROSITE收录的JMJC序列信息的详细界面了。
-
Accession: 是该motif序列信息在ProRule database对应的ID
-
Dates:包含创建日期和最近修订日期。
-
Data class: 序列类别。包含(Domain、Site、Protein)
-
Predictors: 预测信息
-
Name & Function:名称和功能描述
第一步,根据预测ID在番茄(Solanum lycopersicum)里面寻找含有JmjC domain的基因,进入ScanProsite,选取Option2根据motif进行搜索,输入刚才我们看到的Predictors里面JmjC对应的ID。
image image第二步,最好勾选上TrEMBL,这样可以尽量的保证找到更全的基因。关于TrEMBL,之前的文章有介绍,大家可以前往阅读生信入门:蛋白数据库UniProt介绍,在NCBI或者UniProt里面查找Solanum lycopersicum的Taxon identifier是4081,在物种里面填写4081。
image第三步,可以选择图形输出,直接看下搜索的信息。选择FASTA序列格式,可以进一步做下面的分析,比如基因的同源比较,进化树的构建等。这里我们选择图形输出。
image很快,结果就出来了,我们在番茄里面一共找到22个序列信息。可以看到每个基因里面含有的jmjc的位置以及具体的序列信息。
同时PROSITE还可以对一个基因序列进行分析预测含有哪些motif和domain,不需要命令行,不需要安装软件,只需要鼠标点点就可以完成,对做实验的同学非常友好。
END
感谢您的阅读,欢迎点赞、评论、支持和转发!!
image
长按下方二维码,即可加入“基因的生物信息学分析”讨论群。
image相关阅读:
网友评论