复习ChIP-Seq的基础知识

作者: 刘小泽 | 来源:发表于2020-03-10 23:23 被阅读0次

    刘小泽于19.2.3首次接触ChIP-Seq
    中间也没怎么做过相关的项目,不过现在要重拾起来咯,整理一下必备的背景知识(持续补充...)

    背景知识

    • 转录组即某个物种或特定细胞在某一功能状态下产生的所有RNA的总和 (哪些序列能够表达,何时何处表达, 转录活跃程度)
    • 部分基因是能够转录=》染色质多为开放状态;其余基因抑制状态=》染色质状态较为紧密【基因开启、关闭:基因调控】
    • 基因表达调控:信号转导、转录前(染色质构象和表观调控等)、转录调控、转录后调控(剪切、编辑、转运等)、翻译和翻译后调控【针对DNA序列:顺式元件Cis; 针对结合因子包括蛋白和非蛋白因子:反式作用因子Trans】
    • 非编码区大量组织特异性调控序列:增强子enhancer、沉默子silencer、绝缘子insulator等+几个/几十/几百调控因子(转录因子、染色质调控蛋白、组蛋白、RNA分子)+三维结构
    • 目前技术:
      • 分离纯化多拷贝的基因组重复序列,如染色体端粒(telomere):locked nucleic acids (LNAs)和transcription activator-like (TAL)
      • 常规技术:ChIP-seqChIA-PE依赖于单个调控因子或组蛋白修饰【不能纯化、分析单个调控序列所结合的多个调控因子及三维结构】
    • 挑战:native状态下区分结合调控序列的特异性调控因子和细胞内大量的非特异性因子

    基本原理是:

    特定时间点上用甲醛交联等方式“固定”细胞内所有DNA结合蛋白的活动,细胞内蛋白和DNA相互作用的关系被“截屏”了=》然后裂解细胞、断裂DNA(此时存在蛋白、与蛋白相连的DNA、游离的DNA)=》加上特定抗体取出蛋白及相连的DNA=》将与蛋白相连的DNA解离、纯化=》测序=》看到蛋白质抓取的片段们就是IGV中形成的峰,而游离的DNA们就没有峰

    ChIP overview

    发展

    综述:ChIP-seq guidelines and practices of the ENCODE and modENCODE consortia (2012)
    https://www.ncbi.nlm.nih.gov/pubmed/22955991

    染色质免疫沉淀(Chromatin immunoprecipitation ,ChIP)技术诞生很早,由Orlando等人创立于1997年,发表于2000年,先利用Microarray技术 ChIP-chip,后2007年利用DNA sequencing技术 ChIP-seq。虽然技术在进步,但都是要先通过免疫沉淀拉下来DNA。

    它用来研究细胞内DNA与蛋白质相互作用,确定特定蛋白(如转录因子)是否结合特定基因组区域(如启动子或其它DNA结合位点),或确定基因组上与组蛋白修饰相关的特定位点。

    提到两个组织:ENCODE(http://encodeproject.org/ENCODE/ )和modENCODE(http://www.modencode.org/ for small genomes),他们在4个物种(果蝇、秀丽隐杆线虫、人、小鼠)的100多种细胞做了超过1000次ChIP-seq实验,发现了140多种不同的因子和组蛋白修饰
    【与外显子测序不一样,ChIP-seq不是通过设计好的探针来捕获序列,而是通过特异的RNApoly酶、组蛋白、转录因子来捕获,哪里结合蛋白就捕获哪里。每做一次实验,换一个蛋白,所捕获的序列是不一样的】


    刘小泽写于19.9.12
    搜集整理一下必备生物知识

    Part1

    来自:http://www.biomart.cn/specials/biosense/article/109930

    真核生物基因的多级调控:

    • 转录水平:DNA甲基化、基因印记、组蛋白共价修饰、染色质重塑、转录启动、ncRNA
    • 转录后水平:转录后加工、非编码RNA、微小RNA、反义RNA、转录产物转运
    • 翻译水平:翻译调控
    • 翻译后水平:翻译后加工

    转录调控要素:

    • 顺式作用元件(cis-acting element)
      • 启动子(promoter)
      • 增强子(enhancer)
      • 沉默子(silencer)
      • 绝缘子(insulator)
    • 反式作用因子(trans-acting factor)
      • 普通转录因子
      • 转录调控因子:DNA-蛋白互作;组织细胞特异性或基因特异性转录因子;类固醇激素、生长因子或其他刺激后开始表达
      • 共调节因子:蛋白-蛋白互作;共激活因子与共抑制因子

    顺式作用元件的表观修饰:

    • DNA甲基化(DNA methylation):在甲基化酶(DNMTs,包括DNMT1、DNMT3a、DNMT3b)催化下,DNA的CG两个核苷酸,一个甲基添加到胞嘧啶的5’-C分子上,形成5-甲基化胞嘧啶
    • DNA羟甲基化(DNA Hydroxymethylation)
    • 组蛋白修饰(histone modification)
    • 染色质重塑(chromatin remodeling)

    Part2 Epigenomics Fact Sheet

    来自:https://www.genome.gov/about-genomics/fact-sheets/Epigenomics-Fact-Sheet

    什么是表观组?

    • The epigenome is a multitude of chemical compounds that can tell the genome what to do.
    • 基因组中的DNA遵循一定的规律,去构建一个细胞中具有不同功能的蛋白
    • 表观组的化学成分、蛋白复合物可以加到DNA上,指导基因激活还是关闭,控制细胞中蛋白合成,这个过程称为“mark”,也就是修饰
    • 这些用来修饰的成分并不改变基因组的序列组成,只是改变了游戏规则
    • 这些修饰成分有时可以在细胞间传递(例如细胞分裂时),另外还可以从上一代传给下一代

    表观组做了什么?

    人体中包含了超过万亿的细胞,在不同组织中担任不同功能,但是它们细胞核的基因组都是相同的,不同的就是其中不同的基因打开关闭状态。例如眼睛的细胞将检测光的基因特异性激活,而血红细胞会将与氧气运输相关的基因激活。


    刘小泽写于2020.3.10
    看到这篇写的不错:https://abego.cn/2019/08/10/first-series-the-protocol-of-chip-seq/#section-01

    实验角度

    染色质免疫沉淀测序技术(ChIP-Seq),用于寻找转录因子结合的DNA区域,以及寻找发生组蛋白修饰的基因组位置。

    实验上可以分成:Cross-linked ChIP (XChIP)、Native ChIP (NChIP)
    它们之间的比较:https://en.wikipedia.org/wiki/Chromatin_immunoprecipitation#Comparison_of_XChIP_and_NChIP

    • N-ChIP不不涉及甲醛交联,更适合那些和DNA有强相互作用的蛋白ChIP-Seq实验,如组蛋白
    • X-ChIP采用甲醛交联,广泛适用于转录因子, 组蛋白, 聚合酶等蛋白的结合片段测序【大部分都是X-ChIP】

    一般的实验步骤

    1. 首先用化学试剂(通常是甲醛)处理细胞或组织,以使蛋白质与DNA共价交联

    2. 然后进行细胞破碎和超声处理、消化完后, 利用核酸酶将染色质剪切成100-300bp的目标片段

    3. 再利用目标因子特异性抗体纯化

    以上方法适用于能与染色质结合的蛋白质(转录因子,修饰的组蛋白,RNA聚合酶等

    但还存在一些特殊情况:蛋白并没有特异抗体, 或者制备抗体的难度很高。那么就可以通过融合表达标签, 产生具有标签的标记因子,并通过对标签特异的抗体来进行富集

    融合标签参考:http://www.biodiscover.com/news/research/730610.html
    融合标签技术是20世纪末兴起的一种基因重组技术,利用重组DNA技术在靶蛋白编码基因的3'端或5'端融合某种标签的编码基因,通过适宜的宿主来表达重组蛋白质。
    融合标签根据其分子量大小可分为两大类:大的蛋白质分子(或蛋白质结构域及其衍生物)和小的多肽片段

    注意

    • 实验的好坏主要取决于抗体的特异性和对目标分子的亲和能力
    • 一般产生的问题有:对靶标的亲和能力不足;非特异性结合
    • 需要对抗体识别抗原的效率和准确性进行验证:qPCR验证和跑蛋白胶,理论上讲只有IP样本才会有免疫荧光
    • 组蛋白修饰的抗体, 对IP的精度要求更高:因为少量修饰组蛋白和大量的未修饰组蛋白的差异就在少数几个位点上,同时抗体还需要很好的区分出来修饰的位点,比如H3K9me1,H3K9me2和H3K9me3
    • 问题又来了,如果加了标签,那么是否会影响目标蛋白的活性和富集区域?可以加一个mock-ip的对照(也就是标签蛋白或者IgG的IP样本)

    ENCODE的ChIP-Seq指南

    https://genome.cshlp.org/content/22/9/1813.full
    对超过140种转录因子进行了超过一千次独立的ChIP-seq实验,并对多种动植物的100多种细胞类型进行了组蛋白修饰研究
    其中包括:抗体验证,生物学重复,测序深度,数据质量评估

    关于生物学重复

    ENCODE根据细胞系,胚胎和组织样的实验情况。 进行了生物学重复的数量的评估. 结果显示:超过两个生物学重复的ChIP-seq实验没有显着改善位点发现。一般两个重复即可

    关于数据量

    推荐是哺乳动物每个生物重复至少使用10M unique比对的片段;如果是worms and flies :2M unique reads

    反推数据量

    如果去掉PCR重复和没有比对成功的reads(就按最后能得到75%的unique reads来算),并且使用PE 150测序,那么数据量就是:300bp * 10M / 0.75

    更快地计算数据量

    测序报告会给出reads数,如果测序策略是PE150,那么占用硬盘空间大小就是n(reads)*(150+150+45)/1024^3,然后测序仪下机后的数据都是用gz压缩后的文件.fastq.gz,能压缩约2.7倍

    关于对照

    必要性:

    • 超声处理期间DNA断裂不均匀,尤其是开放染色质的一些区域会优先的被超声断裂
    • 测序平台的PCR扩增和检测的偏差导致的不均匀性
    input对照

    对照和处理在相同的条件下,进行交联和片段化,并提取DNA,这部分的DNA是没经过IP的DNA,其余全一样

    Mock-ip对照

    使用与目标蛋白无关的非目标抗体(IgG或者标签)进行“模拟”的IP,为了防止抗体的非特异性结合

    注意
    • ENCODE要求对照组的测序深度至少要等于或者要大于IP样品的测序深度

    • 实际上,很多标签或抗体非特异结合位点是已知的,而且mock IP样本制作复杂,因此使用input样本的比较多

    • 要使用相同的方案来构建IP和对照测序文库, 也就是意味着PCR扩增循环数,片段大小, 测序文库都应该尽量一致


    欢迎关注我们的公众号~_~  
    我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com

    Welcome to our bioinfoplanet!

    相关文章

      网友评论

        本文标题:复习ChIP-Seq的基础知识

        本文链接:https://www.haomeiwen.com/subject/zwhodhtx.html