RNA-seq名词解释(1)

作者: 花生学生信 | 来源:发表于2022-05-06 20:51 被阅读0次

一、基本概念

RNA-seq即转录组测序技术,就是用高通量测序技术进行测序分析,反映出mRNA,smallRNA,noncodingRNA等或者其中一些的表达水平。RNA测序最经常用于分析差异表达基因(DEG)。

转录组是某个物种或者特定细胞类型产生的所有转录本的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。

二、基本名词解释

gene:具有编码蛋白质或决定某一性状作用的一段核酸序列。

Q20,Q30:Phred 数值大于 20、30 的碱基占总体碱基的百分比,其中
Phred=-10log10(e).

intron:内含子,是真核生物细胞 DNA 中的间插序列。这些序列被
转录在前体 RNA 中,经过剪接被去除,最终不存在于成熟 RNA 分
子中。术语内含子也指编码相应 RNA 内含子的 DNA 中的区域。

exon:外显子,是真核生物基因的一部分,它在剪接(Splicing)后仍会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质。外显子是最后出现在成熟 RNA 中的基因序列,又称表达序列。既存在于最初的转录产物中,也存在于成熟的 RNA 分子中的核苷酸序列。术语外显子也指编码相应 RNA 外显子的 DNA 中的区域。

intergenic:基因间区,指基因与基因之间的间隔序列,不属于基因结构,不直接决定氨基酸,可能通过转录后调控影响性状的区域。

UTR:Untranslated Regions, 非翻译区域。是信使 RNA(mRNA)分子两端的非编码片段。5'-UTR 从 mRNA 起点的甲基化鸟嘌呤核苷酸帽延伸至 AUG 起始密码子,3'-UTR 从编码区末端的终止密码子延伸至多聚 A 尾巴(Poly-A)的前端。

transcript:转录本,是由一条基因通过转录形成的一种或多种可供编码蛋白质的成熟的 mRNA。一条基因通过内含子的不同剪接可构成不同的转录本。

isoform:同一个基因经可变剪切或内含子选择机制产生不同的转录本,这些不同转录本即称 isoform。 reconstruction:重组,由于不同 DNA 链的断裂和连接而产生 DNA片段的交换和重新组合,从而形成新 DNA 分子。plus strand/minus strand:正链/负链。对于一个基因来说,DNA 的两条链中有一条链作为 RNA 合成时的模板,这条链叫负链,另一条叫正链。

antisense strand/sense strand:无义链/有义链。模板链在双链 DNA中,用来转录 mRNA 的 DNA 链称为模板链(template strand),不用于转录的链则称为非模板链(nontemplate strand)。根据碱基互补配对原则,转录出的 mRNA 链的碱基序列与非模板链的碱基序列一致,惟一不同的是,非模板链中的 T 在 mRNA 链中全部置换成了 U。正是由于非模板链的碱基序列实际上代表了 mRNA 的碱基序列(只不过在 mRNA 中 T 换成了 U),因此非模板链又被称为编码链(coding strand),有义链(sense strand)和克里克链(crick strand),而用来转录mRNA 的 DNA 链被称为非编码链(anticoding strand)或无义(antisense strand)或沃森链(watson strand)。

gene family:基因家族。真核细胞中,许多相关的基因常按功能成套组合,被称为基因家族。它们来源于同一祖先,由一个基因通过基因重复产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。

gtf/gff:基因结构注释文件。gtf(gene transfer format)指包含基因特
征的注释文件,而 gff(general feature format)是指包含基因组特征
的注释文件。

ORF:open reading frame,开放阅读框或开放读码框。是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的
多肽链,其间不存在使翻译中断的终止密码子。

reference genome/ reference:参考基因组。RNA-seq 有参分析的基础。

small RNA:是长度大约在 18-30bp 的非编码 RNA 分子,包括 micro RNAs、siRNAs 和 pi RNAs,是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要作
用。

ncRNA:non-coding RNA,非编码 RNA。指不编码蛋白质的 RNA。其中包括 rRNA,tRNA,snRNA,snoRNA 和 microRNA 等多种已知功能的 RNA,及未知功能的 RNA。其共同特点是都能从基因组上转录而来,不需要翻译成蛋白即可在 RNA 水平上行使各自的生物学功能。

lncRNA:long noncoding RNA,长链非编码 RNA。长度在 200-100000nt之间,不具有编码蛋白功能的转录本。根据与编码基因的位置关系可分为:Antisense lncRNA (反义长非编码 RNA)、Intronic lncRNA (内含子长非编码 RNA)、Long intergenic noncoding RNA (基因间区长非编码 RNA)、Sense lncRNA(正义长非编码 RNA)、Bidirectional lncRNA(双向长非编码 RNA)。

参考链接:

RNA-seq_百度百科 (baidu.com)

相关文章

  • RNA-seq名词解释(1)

    一、基本概念 RNA-seq即转录组测序[https://baike.baidu.com/item/%E8%BD%...

  • 各种测序基础知识介绍-转发

    各种测序基础知识介绍 RNA-Seq名词解释 index 测序的标签,用于测定混合样本,通过每个样本添加的不同标签...

  • RNA-seq名词解释(2)

    三、建库测序相关: library construction:文库构建,高通量测序前准备步骤。针对不同的研究目的建...

  • RNA-seq名词解释(3)

    四、拼接相关名词解释 assembly:组装/拼接,为得到原始序列,依据重叠关系将段片段融合成长序列的过程。 N5...

  • RNA-seq名词解释(8)

    (十)、分析流程及软件列表 有参转录组:针对有参考基因组序列的物种进行 mRNA 的分析。 无参转录组:针对尚无参...

  • RNA-seq名词解释(4)

    (五)比对相关 blast:Basic Local Alignment Search Tool,一种序列比对的工具...

  • RNA-seq名词解释(7)

    (九)、分析内容相关 gene annotation:基因注释,分为基因的结构注释和基因的功能注释。 CDS pr...

  • RNA-seq名词解释(5)

    (七)分子标记相关 分子标记:是遗传标记的一种,直接在 DNA 分子上检测遗传变异。分子标记能对不同发育时期的个体...

  • RNA-seq名词解释(6)

    (八)比较转录组学相关 比较转录组学:(Comparative Transcriptomics)是一种快速、全面解...

  • RNA-seq转录组名词解释基础

    2019年7月24日,Nature Reviews Genetics上发表了一篇了RNA-seq的综述,文献信息如...

网友评论

    本文标题:RNA-seq名词解释(1)

    本文链接:https://www.haomeiwen.com/subject/qfpzyrtx.html