美文网首页ATAC
染色质可及性(一):相关概念及实验方法

染色质可及性(一):相关概念及实验方法

作者: 熊猫人和熊猫猫 | 来源:发表于2023-04-08 17:43 被阅读0次

    1. 表观遗传学--是什么?

    表观遗传(Epigenetics):是指DNA序列未发生变化,但基因表达却发生了可遗传改变。这种改变的特点: 可遗传性可逆性、没有DNA序列的变化。"可逆性"表现为,表观遗传的修饰方式可以在某些因素的条件下被去除,这使得生物体可以通过调控表观遗传来影响生物性状。

    表观遗传改变主要从四个层面调控基因表达:DNA甲基化;组蛋白修饰,染色质重塑,非编码RNA的调控(后面两种本文不做介绍)

    1.1 组蛋白修饰

    组蛋白修饰(histone modification)是指组蛋白在相关酶的作用下发生甲基化,乙酰化,磷酸化,腺苷酸化,泛素化,ADP核糖基化等修饰的过程。通过对结合DNA的组蛋白进行不同的化学修饰,可以实现对基因表达的调控。组蛋白修饰酶包括组蛋白乙酰化酶(HAT),去乙酰化酶(HDAC),甲基转移酶,去甲基化酶等。其原理是通过影响组蛋白与DNA双链的亲和性,从而改变核小体结构以及染色质的疏松或凝集状态。

    如下图所示,乙酰化酶(HAT)可以通过促进组蛋白的乙酰化,使得染色质达到疏松状态可实现基因转录;去乙酰化酶(HADC)可以通过组蛋白的去乙酰化,使得染色质称为凝集状态而使得基因表达沉默。

    组蛋白-乙酰化促进染色质开放

    组蛋白修饰不能单独发生作用。组蛋白修饰常常和DNA甲基化共同发生作用。

    1.2 DNA甲基化

    DNA甲基化:主要针对胞嘧啶碱基,由DNA甲基化酶辅助将甲基从SAM分子上转移到胞嘧啶C5位置,得到5-甲基胞嘧啶。

    DNA甲基化示意图

    CpG岛(Cytosine-phosphate-Guanine island):指富含CpG二核苷酸的一些区域(要求:长度超过200个C-G碱基对;GC含量超过50%),基因组中满足这些条件的区域便称为CpG岛。
    60%的哺乳动物启动子中含有CpG岛(大多数是未甲基化的),启动子外的区域很少发现,主要是由于CG抑制(减少突变:CG二核苷酸中的C甲基化后易突变为T)。
    CpG岛的功能(CpG岛的甲基化碱基实现): 调节细胞特异性表达,特异性基因的抑制,控制imprinted gene,X染色体失活
    bilibili视频:理解DNA甲基化和CpG岛

    左侧:核小体相对比较分散(组蛋白乙酰化,DNA序列中少有甲基化)
    右侧:在DNA甲基化转移酶及组蛋白去乙酰酶的作用下,DNA发生甲基化同时组蛋白去乙酰化,核小体结构变拥挤,基因表达沉默


    DNA-甲基化和组蛋白去乙酰化共同抑制染色质开放

    转录组 在本质上其实是高度协调的基因表达程序的副产物。无论组蛋白修饰和DNA甲基化如何调控,其最终结果都会导致染色质可及性的变化。

    2. 染色质可及性

    染色质可及性: 又称染色质开放程度,反映了染色质的转录活性状态,是研究基因表达调控的重要方向,在表观遗传图谱绘制、细胞分化和发育及各类疾病的发生发展研究中具有重要的作用。

    2.1 需要理解的几个概念

    转录因子(Transcription Factors, TFs):指能够以序列特异性方式结合DNA并且调节转录的蛋白质。其调控方法通常为:调控和招募RNA聚合酶与DNA模板的结合。
    基序(motif):转录因子与特异性DNA结合的序列通常概括为“基序”。
    启动子(promoter):DNA分子上能与RNA聚合酶结合并形成转录起始复合体的区域(本质上为DNA序列)。常规启动子以二型为主,核心序列包含TATA box和CAAT box,这两部分组成的序列含有基础转录活性,也就是具备启动子特征,但是表达水平很低,此序列紧挨着转录起始位点TSS,一般位于编码基因5UTR上游的300bp之内。

    2.1.1 “转录因子-启动子-RNA聚合酶” 的关系

    真核生物中:转录因子通过识别TATA box首先结合到启动子区域,然后招募RNA聚合酶结合到对应启动子DNA序列


    “转录因子-启动子-RNA聚合酶” 的关系

    2.1.2 “增强子-转录因子-启动子-RNA聚合酶” 的关系

    增强子(Enhancer):又称为强化子,是DNA上一段可与蛋白质结合的区域,与蛋白质结合之后,基因的转录作用将会增强。增强子是转录因子结合位点的密集簇,可能位于基因上游,也可能位于下游。且不一定接近所要作用的基因,甚至不一定与基因位于同一染色体。基于looping的模型在增强子-启动子远端连接的鉴定得到大多数实验支持。

    增强子-转录因子-启动子-RNA聚合酶:结合启动子的转录因子又称为 general transcription factors(图中简称 Gen TF)

    Peak:即开放染色质区域,reads覆盖区域,peak的峰值越高,代表在某个位置染色质的开放程度越高。ATAC-seq中的peak,往往是启动子、增强子序列(转录因子可以结合 启动子或增强子)

    2.2 染色质可及性-研究方法

    目前研究染色质可及性的方法主要有以下四种:MNase-seq、DNase-seq、FAIRE-seq、ATAC-seq。
    从下图可以看到,2013年ATAC-seq方法出现后便成为了染色质可及性分析的主流方法。


    2013-2019年Pubmed中各类方法数据集的数量
    2.2.1 MNase-seq

    微球菌核酸酶(MNase)是来源于金黄色葡萄球菌分泌的一种核酸酶,同时具备核酸外切酶和内切酶活性。
    剪切原理:MNase优先对裸露的DNA或核小体之间起连接作用的DNA进行切割和消化,在对核小体两侧DNA链依次进行内切后(形成双链末端),并从末端向片段的中心位置逐个切下碱基对,直到遇到核小体或DNA结合蛋白等阻滞物。最终获得单个核小体组蛋白上查绕的DNA,最后进行二代测序分析。

    MNase-seq检测染色质可及性原理
    2.2.2 DNase-seq

    脱氧核糖核酸酶I(DNase I)是一种核酸内切酶,可以特异性得对双链DNA进行切割。DNase I敏感的位点在基因组学和染色质的研究中被认为具有开放且可接近染色质的特性。低浓度的DNase I可以切割基因组上非核小体占据的开放区域,这些区域被称为是DNase I敏感位点。


    DNase-seq 检测染色质可及性分析
    2.2.3 FARIE-seq

    FARIE-seq为甲醛辅助的调控元件的分离,是一种直接检测无核小体占据的DNA序列的方法。其原理是,缠绕有DNA的核小体和无核小体结合的DNA,在苯酚和氯仿中的浓度不同:缠绕有DNA的核小体分布于两相交界处,而无核小体的DNA分布于亲水相。总的来说,FAIRE-seq直接富集了活化染色质的区域,可直接用于任何类型的细胞或组织。

    2.2.4 ATAC-seq

    ATAC-seq是2013年由美国斯坦福大学的William Greenleaf开发的检测开放染色质的方法,主要依赖于Tn5转座酶对片段化DNA和整合入活化的调控区域的高敏感性。
    在ATAC-seq中,500~50,000个未固定的细胞核被Tn5转座酶标记上测序接头。由于核小体的空间位阻效应,Tn5转座酶携带已知序列主要插入整合到染色质的开放区域,经PCR扩增后,进行PE150测序。


    ATAC-seq 检测染色质可及性分析:转座酶会携带特定的已知序列,然后将这些序列插入到开放的染色质区域中,最后将带有转座酶标记过的序列上机测序,通过计算分析就能获得基因组哪些地方是开放的
    研究方法 适用细胞类型 细胞数量 目标序列 优点 缺点
    MNase-seq 任何细胞 1x107 被核小体/转录因子保护的DNA片段 直接定位核小体/转录因子 酶的用量需要准确控制
    DNase-seq 任何细胞 1x107 两个开放位点之间的DNA片段 直接获取开放区域信息 样本制备过程复杂,酶的用量要准确控制
    FAIRE-seq 任何细胞 1x105~1x107 两个开放位点之间的DNA片段 直接获取开放区域的信息,灵敏度高 信噪比低,数据解读困难
    ATAC-seq 新鲜或冻存细胞 5x102~5x104 两个开放位点之间的DNA片段 直接获取开放区域的信息,细胞需求量少,灵敏度高,重复性好 容易引入线粒体污染

    相关文章

      网友评论

        本文标题:染色质可及性(一):相关概念及实验方法

        本文链接:https://www.haomeiwen.com/subject/raurddtx.html