可以帮助我们了解,各种比较条件下,所有基因的表达情况的差异。
应用:正常组织/肿瘤组织;治疗前/治疗后;不同发育阶段;不同组织之间等。
检测范围:mRNA表达量;mRNA的可变剪接;融合基因;SNP
测序方法
建库(illumina公司的Truseq RNA建库)
正常抽提到的总RNA有95%是rRNA,只有2-3%是mRNA。
文库质量要求:mRNA要完整。建议先对总RNA进行一次电泳质检,并进行打分。
RIN值(RNA Integrity Number)范围为0-10分,建议使用8.0以上的样本进行检测。

建库流程

- 带Poly(T)探针的磁珠与总RNA进行杂交,吸附其中的带Poly(A)尾巴的mRNA,回收磁珠,把带Poly(A)的mRNA从磁珠上洗脱下来
- 把洗脱下来的mRNA用Mg2+溶液进行处理,把mRNA打断
- 被打断的mRNA片段用随机引物进行逆转录,形成第一链cDNA
- 合成第二链,形成双链cDNA
- 在cDNA的3'端加上A碱基
- 在双链cDNA的两端接上Y形接头
- 经过PCR扩增,成为可以上机的文库
生信分析
判断标本质量
先把测到的RNA片段mapping到基因组上,检查一下多少片段在3'端位置,多少在5'端位置,来判断mRNA是否完整。


mRNA表达量差异分析
RPKM(Reads Per Kilobase of exon model per Million mapped reads)

1. 火山图

横轴:某个基因的表达量是上升(→)还是下降(←)。
纵轴:差异的置信程度。红:置信程度较高;蓝:置信程度较低。
每个点:两个样本当中同一个基因的mRNA表达量的变化

2. 聚类分析
通过多个样本的全基因表达谱对比,来找到他们之间的相似性和相近关系。

应用:分析疾病亚型;探索新的Biomarker。
3. GO分析(Gene Ontology)
Gene Ontology:国际化的基因功能分类体系。主要描述三个属性:参与的生物过程;基因产物的功能;基因产物在细胞器内的空间定位。

显示在生物过程、细胞组分、分子功能富集的差异基因的个数分布情况。

从上到下,它所定义的功能范围越来越小,越来越精准。分支表示包含关系,颜色越深表示富集关系程度越高。
4. 通路分析
通路(Pathway)是指在系统水平上完成生物的某一功能的基本单元或者局部子网络。
KEGG(Kyoto Encyclopedia of Genes and Genomes)(基因功能数据库)

衡量指标:Rich factor、Q value、富集到此通路上的基因个数。点的面积越大,富集的基因数越多;富集因子越大,富集程度越大;Qvalue越接近0,富集程度越显著。
RNA的结构变异分析
需要测序深度较深,建议10G以上数据量。
- 可变剪接
-
融合基因
一个癌细胞中的融合基因示意图
融合基因交接点
- 点突变
表示点突变的泡泡图
Frequency越高,泡泡越大,逆时针排列。
以上内容均源于网络视频《陈巍学基因——视频7:RNA-seq》。
网友评论