美文网首页
ChIP-seq 分析:数据质控实操(5)

ChIP-seq 分析:数据质控实操(5)

作者: 数据科学工厂 | 来源:发表于2023-02-18 11:34 被阅读0次

1. 数据

今天将继续回顾我们在上一次中研究的 Myc ChIPseq。这包括用于 MEL 和 Ch12 细胞系的 Myc ChIPseq 及其输入对照。

  • 可在此处找到 MEL 细胞系中 Myc ChIPseq 的信息和文件
  • 可在此处找到 Ch12 细胞系中 Myc ChIPseq 的信息和文件
  • 可以在此处找到 MEL 细胞系的输入控制
  • 可在此处找到 Ch12 细胞系的输入对照。

2. 质量控制

ChIPseq 有许多潜在噪声源,包括 * 抗体的不同效率 * 非特异性结合 * 文库复杂性 * ChIP 伪影和背景。

许多这些噪声源都可以使用一些完善的方法进行评估。

2.1. 质控参考

  • Encode 质量指标。

Large-scale quality analysis of published ChIPseq data. Marinov GK, Kundaje A, Park PJ, Wold BJ. G3 (Bethesda). 2014 Feb 19;4(2)

  • ChIPseq 中人工制品重复的高估。

Systematic evaluation of factors influencing ChIPseq fidelity.Nat Methods. Chen Y, Negre N, Li Q, Mieczkowska JO, Slattery M, Liu T, Zhang Y, Kim TK, He HH, Zieba J, Ruan Y, Bickel PJ, Myers RM, Wold BJ, White KP, Lieb JD, Liu XS. 2012 Jun;9(6)

  • 什么时候 QC 有用。

Impact of artifact removal on ChIP quality metrics in ChIPseq and ChIP-exo data.Front Genet. 2014 Apr 10;5:75.Carroll TS, Liang Z, Salama R, Stark R, de Santiago I

2.2. 合适的输入

  • 在 IP 富集之前,输入样本通常由片段化的 DNA 制成。
  • 允许控制样本中出现的伪影区域。
  • 切勿在不考虑使用哪个输入的情况下运行 ChIPseq。

例如:当使用肿瘤样本进行 ChIPseq 时,匹配输入样本很重要。同一组织的不同条件可能共享共同的输入。

2.3. 质量指标

ChIPQC 包将一些指标包装到 Bioconductor 包中,并注意在适当的条件下测量这些指标。

要运行单个样本,我们可以使用 ChIPQCsample() 函数、相关的未过滤 BAM 文件,我们建议提供黑名单作为 BED 文件或 GRanges 和基因组名称。

您可以在 Anshul Kundaje 的网站或直接从 Encode 网站找到大多数基因组的黑名单

QCresult <- ChIPQCsample(reads = "/pathTo/myChIPreads.bam", genome = "mm10", blacklist = "/pathTo/mm10_Blacklist.bed")

我们从 Encode 下载 mm10 的黑名单。然后,我们可以使用 ChIPQC 包中的 ChIPQCsample() 函数对我们的 ChIPseq 样本质量进行初步分析。

在这里,我们评估我们在之前的会话中使用 Rsubread 对齐的样本的质量。返回的对象是 ChIPQCsample 对象。

library(ChIPQC)
toBlkList <- "~/Downloads/ENCFF547MET.bed.gz"
chipqc_MycMel_rep1 <- ChIPQCsample("SR_Myc_Mel_rep1.bam", annotation = "mm10", blacklist = toBlkList,
    chromosomes = paste0("chr", 1:10))
class(chipqc_MycMel_rep1)
chipqc_MycMel_rep1

我们可以显示我们的 ChIPQCsample 对象,它将显示我们的 ChIPseq 质量的基本摘要。

chipqc_MycMel_rep1
chipqc_MycMel_rep1

2.4. 多样本QC

最好对照您的输入对照和我们正在使用的其他 Myc 样本(如果您没有自己的数据,甚至是外部数据)检查 ChIPseq 质量。

这将使我们能够识别样本与对照中 ChIPseq 富集的预期模式,并通过这些指标发现任何异常样本。

我们可以使用 lapply 对所有感兴趣的样本运行 ChIPQCsample()。

bamsToQC <- c("Sorted_Myc_Ch12_1.bam", "Sorted_Myc_Ch12_2.bam", "Sorted_Myc_MEL_1.bam",
    "Sorted_Myc_MEL_2.bam", "Sorted_Input_MEL.bam", "Sorted_Input_Ch12.bam")
myQC <- bplapply(bamsToQC, ChIPQCsample, annotation = "mm10", blacklist = toBlkList,
    chromosomes = paste0("chr", 1:10))
names(myQC) <- bamsToQC

所有 ChIPQC 函数都可以与 ChIPQCsample 对象的命名列表一起使用,以将分数聚合到表和图中。

在这里,我们使用 QCmetrics() 函数来概述质量指标。

QCmetrics(myQC)
myQC

本文由mdnice多平台发布

相关文章

  • ChIP-seq 分析:数据质控实操(5)

    1. 数据 今天将继续回顾我们在上一次中研究的 Myc ChIPseq。这包括用于 MEL 和 Ch12 细胞系的...

  • 宏基因组实战

    宏基因组分析理论教程微生物组入门圣经+宏基因组分析实操课程1背景知识-Shell入门与本地blast实战2数据质控...

  • 单细胞测序-scRNA-seq数据的标准化处理

    我们都知道,从数据质控开始已经进入了scRNA分析阶段,在这个阶段开始测试代码,进行实操是很重要的。测试过程中出现...

  • 单细胞分析:质控实操(五)

    1. 学习目标 构建质量控制指标并评估数据质量 适当的应用过滤器去除低质量的细胞 2. 过滤目标 过滤数据以仅包含...

  • ChIP-seq数据质控

    日常瞎掰   ChIP-seq可以用来研究某种转录因子或者组蛋白(后面统称为蛋白因子吧)在基因组上的结合位置,从而...

  • ChIP-seq 分析:原始数据质控(2)

    1. ChIPseq 简介 染色质免疫沉淀,然后进行深度测序 (ChIPseq) 是一种成熟的技术,可以在全基因组...

  • ATAC-seq 分析(上)

    之前写过ChIP-seq的基础分析:ChIP-seq数据分析(一):从raw reads到peaks,和此文有很多...

  • 单细胞分析之质控(四)

    学习目标 知道如何导入和读取数据,并了解数据的质控,能够对数据进行质控和分析。 1. 质控准备 在基因表达定量后,...

  • nanopore测序数据质控

    目前的nanopore测序质量一般,那么测序质量到底如何,则需要进行量化,也就是数据质控分析。数据质控是数据分析中...

  • 主成分分析

    数据过滤质控之后 PCA分析(gcta) 利用R绘图

网友评论

      本文标题:ChIP-seq 分析:数据质控实操(5)

      本文链接:https://www.haomeiwen.com/subject/mrqbkdtx.html