美文网首页
基因PolyA预测

基因PolyA预测

作者: drlee_fc74 | 来源:发表于2020-04-23 08:41 被阅读0次

基因在转录的过程收到PolyA的调控,不同的PolyA尾可以导致基因产生不同的3'UTR异构体。进而也就影响了基因3'UTR的功能了。因此一个基因的PolyA的位置对于这个的3'UTR的功能至关重要。

背景介绍

新RNA的裂解和聚腺苷酸化(C / P)对于几乎所有真核mRNA和长非编码RNA(ncRNA)的3'端成熟都是必不可少的,它可以终止转录。其中C/P也称为PolyA位点(PAS)。大多数真核基因带有多个PAS,导致选择性多聚腺苷酸化(alternative polyadenylation, APA)表达。大多数PolyA位点位于mRNA的3'非翻译区(3'UTR)中,从而导致具有不同3'UTR长度的异构体。因此预测一个基因的PolyA对于鉴定3'UTR的异构体至关重要。

image

之前对于PolyA的预测是基于cDNA序列来进行预测的。这样预测的结果就是可能序列上的预测,但是结果有可能不是一个真正的PolyA。随着高通量测序的技术的,我们可以通过3'end的测序技术来检测基因的真正的PolyA位置。基于这个目的,所以就有了PolyA_DB(http://exon.njms.rutgers.edu/polya_db/v3/)数据库和polyAsite( http://polyasite.unibas.ch/))。这两个数据库也是前两天那个综述推荐的一个和3'UTR有关的数据库。

PolyA_DB:

这个数据库支持四个物种的PolyA位点查询,分别是:人、小鼠、大鼠和鸡。我们需要做的就是

  1. 确定物种
  2. 输入基因名
image

结果的输出包括一个基因的基本信息

image

对于PolyA位点的结果也可以通过UCSC浏览器来查看,我们点击图片当中的链接就可以查看具体的信息了

image

同时数据库也提供了和目标基因相关的所有PolyA位点信息:

image

对于图片当中的结果解读的话:

  • PAS type: mRNA中的PAS位置,包括5'UTR,CDS和3'UTR。 对于3'UTR中的PAS,它们进一步分为First(3'UTR(F)),Middle(3'UTR(M))和Last(3'UTR(L))。 如果3'UTR中只有一个PAS,则称为3'UTR(S)
  • PAS Signal:PAS信号位于PAS上游40 nt之内,包括AAUAAA,AUUAAA,其他AGTAAA,TATAAA,CATAAA,GATAAA,AATATA,AATACA,AATAGA,AAAAAG,ACTAAA),A-rich(AAAAAA)和 没有。
  • PSE :(所有样品中)带有表达的样品的百分比。
  • Mean RPM:所有样本中每百万PAS reads的平均reads数。
  • Conserv:PAS是否在其他物种(包括人(H),小鼠(M),大鼠(R)和鸡(C))中也保守。 并且我们将在至少两种哺乳动物中保守的PAS定义为哺乳动物保守的PAS。

数据结果下载:

这个数据库提供了所有内置数据下载的界面。我们可以下载所有的数据来进行离线的DIY。

image

PolyASite

PolyASite数据库也是基于测序数据来预测基因PolyA位点的数据库。恰巧的是,这个数据库刚刚更新,相较于之前纳入的测序的数据扩大了很多。属于目前最新,纳入数据量最大的PolyA相关的数据库了。

image

数据库的使用,和之前的PolyA_DB一样很简单,我们只需要选择物种,输入感兴趣的目标就行。这个感兴趣的靶标可以是:基因组的位置;基因名;或者ENSID号

image

输出的结果也就包括具体发现的PolyA位点的具体信息:

image

结果当中包括了一个Cluster的结果,这个类似于把相近的几个PolyA位点来聚类到一起当作一个范围来考虑了。我们可以点击具体的位点,同样的具体的结果可以在UCSC基因浏览器上可视化

image

总结

对于PolyA的确定其实主要的还是还是来研究其选择性多聚腺苷酸化(alternative polyadenylation, APA)。进而研究不同的3'UTR异构体对于机体的影响。目前也有几个APA相关的数据库。我们明天来介绍一下和APA相关的数据库

相关文章

  • 基因PolyA预测

    基因在转录的过程收到PolyA的调控,不同的PolyA尾可以导致基因产生不同的3'UTR异构体。进而也就影响了基因...

  • Meta基因预测:概念

    什么是基因预测 所谓基因预测,简单地讲就是预测编码区(CDS)。 原核生物与真核生物基因的差别: 真核生物基因有内...

  • 基因预测及注释原理

    基因预测方法(一)基因预测方法(二)基因识别需要解决两大问题:预测出编码蛋白质的区域,并找出基因的各个功能位点主要...

  • [lncRNA|数据库] lncRNA功能预测

    lncRNA功能预测 我们在基因研究的时候,需要提前预测这个基因的功能是什么。编码基因可以通过其基因的蛋白结构来预...

  • Nanopore PolyA Tail Length Analy

    使用pipeline-polya-ng在运行前下载软件,使用的是conda的flair_env环境,polya n...

  • 转录因子靶基因互相预测全网最全,没有之一

    转录因子靶基因互相预测全网最全,没有之一 还记得先前提到的基因转录调控数据库“转录因子靶基因预测,不用到处搜了,都...

  • polya定理

    Pólya定理:用于解决等价类计数问题的,所谓等价类计数问题是指题目中会定义一种等价系,满足这个关系的元素都会被看...

  • 基因组分析工具

    Prodigal(基因预测) RNAmmer (rRNA预测) 先安装hmmer-2.2g 下载http://ww...

  • 未来人才成长路径预测推荐计划

    加快研究基因预测技术。将基因预测技术与综合兴趣测评,心理测评和脑科学思维优势测试相结合,推荐人才成长路径的...

  • 预测模型第2篇|基因表达预测模型登上血液学顶级期刊

    简介 2020年2月血液学顶级杂志 Leukemia杂志发表了我国多中心研究:基因基因表达的预测模型预测成人淋巴瘤...

网友评论

      本文标题:基因PolyA预测

      本文链接:https://www.haomeiwen.com/subject/beanihtx.html