【张勇】ChIP-seq 讲习班

作者: caokai001 | 来源:发表于2020-06-22 23:59 被阅读0次

参考:

本讲 PPT 下载链接为:http://pan.baidu.com/s/1skJAaAx,密码:ga2l
视频链接:https://mp.weixin.qq.com/s/JLPQbgQKUpa4ONNhzURQxw

image.png

第一部分:ChIP-seq 简介

image.png
  • 首先了解两个概念:

Cistrome: the set of cis-acting targets of a transacting factor on a genome scale.

Epigenome: a parallel to the word "genome"; the overall epigenetic state of a cell

  • 一般的双端测序,R1/R2 比对到两条链上面。通过Flag 可以提取比对到正反链的read,使用基因组浏览器可视化得到两个峰图。

    (Tips:而ChIA-PET 也是双端测序,但是R1/R2 可能同一条链)

    参考: 双端测序中read1和read2的关系

    image.png image.png
image.png image.png
  • 张勇老师开发出第一个peak callling 工具(macs,现在更新到macs3,由师弟刘涛维护!)
image.png
  • ChIP-exo : 从5 -end 进行酶切,提高TFBS分辨率,几乎直接看peak,而不需要软件找。
image.png
  • iChIP : 对不同细胞进行index,再进行抗体富集,运用到单细胞领域.

    image.png
  • 不同的TF 结合模型:

    一般TF是sharp peak.

    image.png

第二部分:ChIP-seq 实验设计

image.png image.png image.png
  • 关于实验重复及其测序深度:

    • 以人类为例,一般对于转录因子达到20M,宽峰达到40M read 比较好。当然read越多越好,但是read 不太多,足以检测结合比较强的位点。
    • 重复的问题,由于刚开始的一些文章ChIP-seq没有重复,带了一个不好的头,后面慢慢要求2-3个重复(2-3个质量好的重复,不是做了3个重复就好)。
    image.png
  • 对照组:一般来说Input 和IgG 有一个就行,对于一些特别容易富集的区域,也就是假阳性,可以通过对照组来过滤掉。

image.png

第三部分:检测ChIP质量

image.png
  • 通过IGV浏览器查看peak 是否明显

    image.png
  • 通过计算Frip 值:不同的TF,Frip 大小不同,结合越强的位点,Frip 可能越高

    image.png
  • 交联系数:通过移动 计算正反链read 皮尔逊相关系数变化过程。

    • 高质量的ChIP 正负链的peak ,移动到最大 重叠位置,相关系数最大,也就是图中ChIP peak 位置。
    image.png
  • 同时比较两个peak高度值,计算差异倍数,得到NSC/RSC 结果.下图左边为质量高的实验结果.

image.png
  • 同时计算Frip 和NSC关系,两者之间存在明显的联系.也就是说Frip 高的NSC,RSC 往往也较高。

    image.png
  • IDR 方法:此方法对于重复间质量好的样本,IDR可能效果好,否则满足条件的peak 会很少。

    从B图可知,20000左右的peak ,IDR (不可重复率)较低,也就是peak 很可信。

    image.png image.png
  • 也可以通过peak 区域motif 富集情况,评价质量好坏。

    image.png
  • 通过序列保守型来看:也就是通过通过profile 图反映出富集效果。

    image.png

第四部分:完成项目后,需要提交哪些数据

image.png image.png image.png image.png

第五部分:分析流程

image.png
  • 第一步:数据比对
image.png
  • 下一步:peak calling
image.png
  • 要发布的部分peak calling 工具

    image.png
  • 下一步:差异peak 分析

    • 定性问题:通过设置阈值,对两组sample进行peak 差异位点分析。得到有无peak的差异结果,但是对于一些在阈值边界的位置,可能得到的差异peak 位点,存在假阳性问题。
    • 定量问题:通过差异倍数,及其显著性来判断差异peak. 对于组蛋白修饰来说,修饰水平的高度和表达强弱有关系;但是对于转录因子来说,可能没有太大影响。
    image.png
  • 差异peak 目前的工具
image.png
  • 下一步:peak注释

    image.png
image.png
  • 下一步:motif 分析

    image.png
  • 目前的工具

    image.png
  • 下一步:靶基因预测

    image.png
  • 也可以尝试对TF进行敲除,过表达研究目标基因.

    image.png
  • 下一步:目标基因GO注释

    image.png

思考

  • 感觉做差异分析时候,定量分析采取Deseq2 或者DiffBind 结果差别较大时候,不好判断选择哪一个工具result.
  • 了解到ChIP-seq 靶基因寻找工具。比如结合RNA-seq结果,判断敲除TF,那些基因是差异基因。工具如BETA


欢迎大家评论留言,相互学习~

相关文章

网友评论

    本文标题:【张勇】ChIP-seq 讲习班

    本文链接:https://www.haomeiwen.com/subject/wwmqfktx.html