美文网首页
测序数据上游分析--质量控制

测序数据上游分析--质量控制

作者: 医学小咖成长之路 | 来源:发表于2021-02-01 11:38 被阅读0次

感谢小学学!

测序原理:

将基因打断成片段reads;每段reads一端连接不同的UMI做为标识;PCR;测序

uniquely mapped reads:reads的唯一性由UMI和map位置共同确定

PCR duplicates:pcr后,UMI相同且map位置相同的reads会扩增很多条,去duplicates就是,仅保留一条,去除由于PCR效率不同导致的差别

基因表达量=sum(去除duplicates后的uniquely mapped reads)

expression A = read1 + read2 +read3

expression B = reada + readb +readc +readd +reade

影响分析的因素:

文库大小的影响:文库越大,细胞越多,含有的geneA绝对值就越多

基因长度影响:基因越长,打断后的reads就越多,相加值就越大

测序深度影响:相当于PCR效率不同带来的影响

为什么要PCR:对于chipseq、singlecellseq、atacseq细胞量少,测序时信号非常低,无法检测到,送测前PCR是为了扩大信号。

去duplicates是去除PCR的影响,效果相当于收获样本打成片段后直接测序。

去除文库大小影响,就是去除不同批次收样细胞量不同的影响,效果相当于每次都收获相同量的细胞进行测序

常规RNAseq数据标准化步骤:

counts矩阵,行为sample,列为gene

方法1:

exprSet=mean(colSums(exprSet))*exprSet/colSums(exprSet)

exprSet=log2(exprSet+1)

方法2:TMM(edgr+limma包)

注意:(1)方法1结果全为正,方法2会出现负值;(2)方法1中,当不同批次送样,或同批次但不同lane(没有混样)时需要消除批次效应(具体步骤上网找。方法2包含了去批次处理,不需再去批次。

相关文章

  • 测序数据上游分析--质量控制

    感谢小学学! 测序原理: 将基因打断成片段reads;每段reads一端连接不同的UMI做为标识;PCR;测序 u...

  • [转载]RNAseq: TopHat2 + Cufflinks分

    [转载]RNA-seq :TopHat2 + Cufflinks分析流程 测序数据质量控制:fastqc软件 使用...

  • nanopore测序数据质控

    目前的nanopore测序质量一般,那么测序质量到底如何,则需要进行量化,也就是数据质控分析。数据质控是数据分析中...

  • 转录组分析流程概述

    转录组分析总体流程如图所示,主要分为上游分析(原始数据质量控制、比对、组装、定量),下游分析(差异分析、富集分析)...

  • 单细胞转录组(scRNA-seq)分析01 | Scater包的

    一、介绍 用于单细胞RNA-seq数据 提供严格的质量控制:将原始测序读数处理为可用于下游分析的高质量表达数据集 ...

  • RNA-seq实战分析流程

    一、下载测序数据 ①SRA数据库[存储二代测序的原始数据]②在进行上游分析时,数据格式转换过程概述如下:sra↓F...

  • 四、数据过滤

    1.过滤条件 测序得到的原始序列含有接头序列或低质量序列,为了保证信息分析的准确性, 需要对原始数据进行质量控制,...

  • RNA-seq :TopHat2 + Cufflinks分析流程

    1、测序数据质量控制:fastqc软件 1)使用方法:/life/rjian/software/fastQC/Fa...

  • RNA-seq数据的上游处理及工具HISAT2; STAR; R

    欢迎批评指正 一、上游处理流程 上游处理步骤包括质量检测、质量控制、比对、定量[2],每一步处理数据的目的都是不同...

  • 数据的质量控制软件 | FastQC

    拿到二代测序数据后,首先要查看一下测序质量如何,以评估该测序数据是否满能够进行后续的生信分析。 这里介绍一款常用的...

网友评论

      本文标题:测序数据上游分析--质量控制

      本文链接:https://www.haomeiwen.com/subject/nssjtltx.html