circRNA蛋白编码能力分析
环状RNA(circular RNAs,circRNA)是一类具有闭合环状结构的 RNA 分子,可参与许多生物学功能,最近研究表明部分circRNA能够编码多肽,并通过编码多肽实现生物学功能。
1 circRNA的ORF预测
在分子生物学中,开放阅读框(Open Reading Frame, ORF)从起始密码子开始,是DNA序列中具有编码蛋白质潜能的序列,结束于终止密码子连续的碱基序列。对于circRNA而言,RNA序列至少拥有一条ORF是其能成功编码蛋白的首要条件。
(1)Chr:circRNA基因所在的染色体;(2)Seq:circRNA基因所在的染色体位置;(3)Name:circRNA的名称;(4)Length:circRNA的长度;(5)Target:circRNA的靶基因;(6)Juction:circRNA预测的ORF是否包含junction连接位点(若包含junction,则有可能产生circRNA特异性肽段,更易说明该肽段是由circRNA翻译的);(7)ORF:circRNA预测的ORF(即翻译过程的序列所在位置,若Juction为TRUE时,ORF经过连接位点,故可能出现后大于前的情况);(8)Protein:ORF翻译的肽段蛋白blast结果;(9)Peptide:ORF翻译的肽段氨基酸序列。
2 circRNA的IRES区域预测
内部核糖体进入位点(Internal Ribosomal Entrance Site, IRES)序列有着特殊高级结构,是一段可以与核糖体结合直接起始翻译的序列,对于没有5’帽结构的circRNA而言,拥有IRES序列也是其有编码蛋白潜力的必要因素。
(1)ID:circRNA所在的染色体和位置信息;(2)Index:circRNA的IRES的结果,IRES表示至少一段序列分析结果为IRES序列,non-IRES表示全部序列分析结果为无IRES序列;(3)High:全部序列中IRES预测结果分数最高的序列位置;(4)Score:全部序列中IRES预测结果分数最高的得分;(5)IRES:全部分析包含IRES结果的序列,预测得分大于0.5时则认为包含IRES序列。
3 circRNA的蛋白编码能力预测
对于给定的circRNA序列,根据ORFfinder和IRES finder master两个软件的结果,若circRNA同时满足:(1)包含至少1段ORF区域;(2)IRES分析至少有一段分析包含IRES片段,则认为该circRNA具有编码蛋白潜力,本次共有366/526个circRNA具有编码蛋白潜力。
(1)ID:circRNA所在的染色体和位置信息;(2)Chr:circRNA所在的染色体;(3)Seq:circRNA所在染色体位置;(4)Name:circRNA的名称;(5)Length:circRNA的长度;(6)Target:circRNA的靶基因;(7)ORF:circRNA预测的ORF(即翻译过程的序列所在位置,若Juction为TRUE时,ORF经过连接位点,故可能出现后大于前的情况);(8)Juction:circRNA预测的ORF是否包含junction连接位点(若包含junction,则有可能产生circRNA特异性肽段,更易说明该肽段是由circRNA翻译的);(9)Protein:ORF翻译的肽段蛋白blast结果;(10)Peptide:ORF翻译的肽段氨基酸序列。(11)Index:circRNA的IRES的结果,IRES表示至少一段序列分析结果为IRES序列,non-IRES表示全部序列分析结果为无IRES序列;(12)High:全部序列中IRES预测结果分数最高的序列位置;(13)Score:全部序列中IRES预测结果分数最高的得分;(14)IRES:全部分析包含IRES结果的序列,预测得分大于0.5时则认为包含IRES序列:(15)result:最终分析结果,translatable表示circRNA符合编码蛋白的要求,具有编码蛋白的潜力,no ROF find表示circRNA中无预测的ROF序列,non-IRES表示circRNA中虽有ROF序列,但没有IRES序列。
网友评论