在进行功能注释和通路注释之前,我们会先将差异蛋白与合适的数据库中的蛋白序列进行比对。目的一:很多物种目前研究的程度还很有限,关于这些物种的蛋白注释信息还很不完善。根据相似性原理,具有相似序列的蛋白可能也具有相似的功能,因此,我们可以将 BLAST 所得的同源蛋白的注释信息转嫁到我们关注的差异蛋白上,来完成对于差异蛋白尤其是研究程度不足的物种的差异蛋白的注释。目的二:我们在查库过程中,为了得到更多的蛋白质鉴定信息,我们大多使用 UniProt 数据库(含 SwissProt 和 TrEmbl:SwissProt 中的蛋白均经过人工校验,数据可靠性高,注释完整;TrEmbl 由基因组序列翻译而来,未经人工校验,注释信息不全)或 NCBI Protein 数据库(用户可任意提交序列,有冗余,信息不完善,质量很难保证),BLAST 一方面可以帮我们提高后续的注释效率,另一方面也可以帮助大致了解所鉴定的蛋白可能的名称和功能(尤其对于 uncharacterized protein,predicted protein,putative protein 等)。
原文链接:https://blog.csdn.net/xxxxy314/article/details/48916279?locationNum=15
网友评论