美文网首页RNA-Seq处理流程转录组数据分析
RNA-Seq(1):RNA-Seq实验原理及数据来源

RNA-Seq(1):RNA-Seq实验原理及数据来源

作者: Z_bioinfo | 来源:发表于2022-02-16 15:02 被阅读0次

快速定位目录:
RNA-Seq(2):数据下载并质控 - 简书 (jianshu.com)
RNA-Seq(3):比对并质控 - 简书 (jianshu.com)
RNA-Seq(4):定量并质控 - 简书 (jianshu.com)
RNA-Seq(5):构建表达矩阵,归一化样本数据以及检测数据可信度并可视化 - 简书 (jianshu.com)
RNA-Seq(6):使用DESeq2进行差异分析 - 简书 (jianshu.com)
RNA-Seq(7):对差异分析结果绘制火山图进行可视化 - 简书 (jianshu.com)
RNA-Seq(8):差异基因KEGG/GO富集分析 - 简书 (jianshu.com)
RNA-Seq(9):使用GSEA做GO/KEGG富集分析 - 简书 (jianshu.com)

1.实验流程

image.png

1.为什么要进行末端修复,产生平齐末端并要3'端腺苷酸化:目前很多PCR使用的高保真Pfu聚合酶产生的片段末端是平齐的(也即没有不配对的碱基);鸟枪法产生的片段则是随机断裂,其末端可能是平齐的也可能是不平的。因此,建库第一步是使用Taq聚合酶补齐不平的末端,并在两个末端添加突出的碱基A,从而产生粘性末端(若使用Taq酶扩增,则无需末端修饰),产生粘性末端的片段可以添加接头(Adaptor)。

2.3'端腺苷酸化的作用:经过末端修饰后的cDNA片段末端具有突出的A尾,而接头具有突出的T尾,可以使用连接酶将BEBNext接头添加到DNA片段两端。

3.为什么要添加BEBNext接头:文库构建即为测序片段添加不同的接头,一般叫P5和P7。无论是PCR产生的片段还是基因组鸟枪法打断的片段都具有特异性(PCR中不同样品反向引物插入了特异性的barcode,因此两端也是特异的),两端缺乏必要的引物因此混合DNA片段不能直接扩增和测序。DNA片段需要加接头修饰才能进行上机测序,如果我们随机在两端加p5或p7,就会有一半的片段两端加的是相同的接头,这种文库是无效的,原因:在测序芯片flow cell上两端一样的文库走不通正常的测序流程,提前作废了,另外,一般的建库PCR过程中,两端一样片段的变性后两端会aneal在一起,引物竞争不上去,本身也扩增不出来。这个问题会导致从一开始就有50%的文库无效,如果能规避一定要规避。DNA本身 就有头尾5“ 3“方向性,连接时Y接头可以让头尾分别只加一种接头。绿色和黄色分别对应P5或P7,只有模板文库片的5端会接绿色,3端接黄色,不会反接,也不会两端接一样的。另外还有一个附带的好处是,这种库是有“方向性”的文库,也就是read1 和read2只会分别读到原有DNA片段的头/尾信息,而不会混淆。这一步添加的接头主要是为了后续PCR中作为引物扩增继续添加文库index(barcode)和与测序平台互补的寡核苷酸序列(P5和P7)

4.使用USER酶删除碱基U:NEB的接头为特殊的碱基U连接的环状结构(可以增强稳定性),因此连接接头后,还需要将碱基U删除从而形成“Y”形接头,而之所以为“Y”型开叉结构,是因为每一端接头是两条不互补的序列,因为连接酶没有选择性,每个接头都是只靠突出的T来与DNA连接,“Y”接头保证了每条单序列两端均为不同的测序引物,从而在后续PCR中可以连接不同的寡核苷酸序列(P5/P7)USER酶在尿嘧啶位置产生一个单核苷酸缺口。USER酶是尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶Endo VIII的混合物。UDG催化尿嘧啶碱基的切割,形成一个脱碱基(脱嘧啶)位点,但保持磷酸二酯骨架结构完整。Endo VIII的裂解酶活力使脱碱基位点3′和5′端的磷酸二酯键断裂,释放无碱基的脱氧核糖。,

4.P5和P7作用:P5、P7接头位于文库两端,可以与flowcell上的寡核苷酸结合,在簇生成和测序过程中可作为引物或起到固定模板链的作用。

5.index1和index2是不同的,与p5相连的是index2,与p7相连的是index1,因为一个lane可以同时测多个样品(一台测序仪同时运行多个样本,提高性价比),为了避免混淆样品的read product,每种样品的DNA由一种index修饰,这样测序得到的read都是具有index修饰的(测序仪识别,相当于身份证),在测序结果过,依据index与样品的对应关系,可以获得对应样品的数据

2.数据处理流程

image.png

3.数据来源

本次教程采用文献RNA-Seq Transcriptome Profiling Identifies CRISPLD2 as a Glucocorticoid Responsive Gene that Modulates Cytokine Function in Airway Smooth Muscle Cells,使用数据为GSE52778。
研究背景:哮喘(ASM)是一种 慢性炎症呼吸道疾病,目前,全球大约有3亿人在承受着该疾病的折磨。Glucocorticoids 即糖皮质激素(下文简称GCs),目前被广泛用来治疗各种炎症性疾病,其中包括哮喘。可吸入型的GCs可直接作用于肺部细胞,GCs主要用于缓解哮喘疾病的症状,并防止哮喘加重。GCs是通过与其受体结果,形成GRs复合物的方式,调节相关基因的表达,激活机体的消炎反应;另一方面抑制炎症因子的表达,达到消炎的目的。
随后验证一批关于地塞米松药物对细胞转录的影响,吃了药物之后,引起哪些基因的差异表达,这些差异表达基因参与哪些代谢,通过这个案例,可以了解药物对代谢的影响。


image.png image.png

四个白人男性的气管平滑肌细胞,8个数据


image.png
image.png

相关文章

网友评论

    本文标题:RNA-Seq(1):RNA-Seq实验原理及数据来源

    本文链接:https://www.haomeiwen.com/subject/tfkvhrtx.html