【张勇】ChIP-seq 讲习班

作者: caokai001 | 来源:发表于2020-06-22 23:59 被阅读0次

    参考:

    本讲 PPT 下载链接为:http://pan.baidu.com/s/1skJAaAx,密码:ga2l
    视频链接:https://mp.weixin.qq.com/s/JLPQbgQKUpa4ONNhzURQxw

    image.png

    第一部分:ChIP-seq 简介

    image.png
    • 首先了解两个概念:

    Cistrome: the set of cis-acting targets of a transacting factor on a genome scale.

    Epigenome: a parallel to the word "genome"; the overall epigenetic state of a cell

    • 一般的双端测序,R1/R2 比对到两条链上面。通过Flag 可以提取比对到正反链的read,使用基因组浏览器可视化得到两个峰图。

      (Tips:而ChIA-PET 也是双端测序,但是R1/R2 可能同一条链)

      参考: 双端测序中read1和read2的关系

      image.png image.png
    image.png image.png
    • 张勇老师开发出第一个peak callling 工具(macs,现在更新到macs3,由师弟刘涛维护!)
    image.png
    • ChIP-exo : 从5 -end 进行酶切,提高TFBS分辨率,几乎直接看peak,而不需要软件找。
    image.png
    • iChIP : 对不同细胞进行index,再进行抗体富集,运用到单细胞领域.

      image.png
    • 不同的TF 结合模型:

      一般TF是sharp peak.

      image.png

    第二部分:ChIP-seq 实验设计

    image.png image.png image.png
    • 关于实验重复及其测序深度:

      • 以人类为例,一般对于转录因子达到20M,宽峰达到40M read 比较好。当然read越多越好,但是read 不太多,足以检测结合比较强的位点。
      • 重复的问题,由于刚开始的一些文章ChIP-seq没有重复,带了一个不好的头,后面慢慢要求2-3个重复(2-3个质量好的重复,不是做了3个重复就好)。
      image.png
    • 对照组:一般来说Input 和IgG 有一个就行,对于一些特别容易富集的区域,也就是假阳性,可以通过对照组来过滤掉。

    image.png

    第三部分:检测ChIP质量

    image.png
    • 通过IGV浏览器查看peak 是否明显

      image.png
    • 通过计算Frip 值:不同的TF,Frip 大小不同,结合越强的位点,Frip 可能越高

      image.png
    • 交联系数:通过移动 计算正反链read 皮尔逊相关系数变化过程。

      • 高质量的ChIP 正负链的peak ,移动到最大 重叠位置,相关系数最大,也就是图中ChIP peak 位置。
      image.png
    • 同时比较两个peak高度值,计算差异倍数,得到NSC/RSC 结果.下图左边为质量高的实验结果.

    image.png
    • 同时计算Frip 和NSC关系,两者之间存在明显的联系.也就是说Frip 高的NSC,RSC 往往也较高。

      image.png
    • IDR 方法:此方法对于重复间质量好的样本,IDR可能效果好,否则满足条件的peak 会很少。

      从B图可知,20000左右的peak ,IDR (不可重复率)较低,也就是peak 很可信。

      image.png image.png
    • 也可以通过peak 区域motif 富集情况,评价质量好坏。

      image.png
    • 通过序列保守型来看:也就是通过通过profile 图反映出富集效果。

      image.png

    第四部分:完成项目后,需要提交哪些数据

    image.png image.png image.png image.png

    第五部分:分析流程

    image.png
    • 第一步:数据比对
    image.png
    • 下一步:peak calling
    image.png
    • 要发布的部分peak calling 工具

      image.png
    • 下一步:差异peak 分析

      • 定性问题:通过设置阈值,对两组sample进行peak 差异位点分析。得到有无peak的差异结果,但是对于一些在阈值边界的位置,可能得到的差异peak 位点,存在假阳性问题。
      • 定量问题:通过差异倍数,及其显著性来判断差异peak. 对于组蛋白修饰来说,修饰水平的高度和表达强弱有关系;但是对于转录因子来说,可能没有太大影响。
      image.png
    • 差异peak 目前的工具
    image.png
    • 下一步:peak注释

      image.png
    image.png
    • 下一步:motif 分析

      image.png
    • 目前的工具

      image.png
    • 下一步:靶基因预测

      image.png
    • 也可以尝试对TF进行敲除,过表达研究目标基因.

      image.png
    • 下一步:目标基因GO注释

      image.png

    思考

    • 感觉做差异分析时候,定量分析采取Deseq2 或者DiffBind 结果差别较大时候,不好判断选择哪一个工具result.
    • 了解到ChIP-seq 靶基因寻找工具。比如结合RNA-seq结果,判断敲除TF,那些基因是差异基因。工具如BETA


    欢迎大家评论留言,相互学习~

    相关文章

      网友评论

        本文标题:【张勇】ChIP-seq 讲习班

        本文链接:https://www.haomeiwen.com/subject/wwmqfktx.html