ATAC-seq(1) -- 实验原理

作者: Z_bioinfo | 来源:发表于2022-07-07 21:13 被阅读0次

    一:染色质可及性

    染色质关闭:压缩DNA

    image.png
    人的DNA链全部展开大约有2m,需要折叠为染色质结构才可以存储到放到细胞核中。染色质的基本结构单位是核小体(由组蛋白组成),核小体再折叠最终形成高度压缩的染色质结构。一般真核生物是这种方式来存储遗传信息。

    这个过程像我们将文件压缩为zip或者rar的压缩包,减少它的占用空间。

    染色质开放:解压DNA

    image.png
    高度折叠的染色质结构在复制和转录时需要暴露出DNA序列,但不是需要DNA链全部解开,只需要打开一部分,也就是表达基因的区域解开即可。而这一过程,主要由染色体组蛋白的修饰(尤其是乙酰化)来实现的,这部分打开的染色质,就叫开放染色质(open chromatin),这个区域可以供转录因子和其他调控元件结合,所以它与转录调控是密切相关的。这种致密的核小体结构被破坏后,启动子、增强子、绝缘子、沉默子等顺式调控元件和反式作用因子可以接近的特性,叫染色质的可及性,也叫染色质开放性(chromatin accessibility )。

    这个过程类似于我们要查看刚刚压缩包里的文件,我们需要解压后才能查看到文件里的内容。

    二、检测染色质可及性

    ATAC-seq,全称Assay for Transposase-Accessible Chromatin with high throughput sequencing,是2013年由斯坦福大学William J. Greenleaf和Howard Y. Chang实验室开发的用来研究染色质可及性(通常也理解为染色质的开放性)的方法
    1. 原理
    ATAC-seq 是通过使用高通量测序技术对转座酶Tn5可接近性核染色质区域进行分析的一种新型表观遗传学研究技术。该技术通过转座酶对某种特定状态下开放的核染色质区域进行切割,获得在该状态下基因组中所有活跃转录的调控序列,再通过聚类分析,挖掘这些开放位点的潜在结合转录因子,结合基因表达水平数据,发现关键的调控转录因子。
    这个技术用到了一个转座酶Tn5:DNA转座是一种由DNA转座酶介导,把DNA序列从染色体的一个区域插入到另外一个区域的现象,类似于“剪切粘贴”。这个过程,也是需要插入位点的染色质是开放的,否则就会被一大坨高级结构给卡住。

    既然转座酶Tn5容易结合在开放染色质上,只要人为地将将NGS接头连接到转座酶,携带这些接头的转座酶(如下图带着红色蓝色测序标签的转座酶Tn5)进入细胞核后,在染色质开放区域各种切切切,使染色质断裂并将这些接头插入到开放的染色质区域中,这样我们裂解细胞、破碎DNA后,利用已知序列的测序标签进行NGS测序,就知道哪些区域是开放染色质了。

    image.png
    开放染色质的研究方法除了ATAC-seq,还有DNase-Seq,FAIRE-seq,MNase-seq 等。ATAC-Seq由于其所需样本少,建库快,重复性更高,是目前研究开发染色质的主流技术方法。
    如下图所示,因为间隔的核小体数目不同,ATACseq 测序插入片段(fragments)分布会呈现多个峰的分布。在约 <100,200,400,600bp 处有峰,分别对应着 NER (nucleosome-free regions) 和 单、双、三核小体区域的 reads. 因此我认为常用的 2150 的双端测序不适合 ATACseq. 因为最需要的 NER 区域 reads 是很短的,用 2150 等于浪费许多的测序通量。
    c530185bd1c9711747a649ed7b6c6e63.png
    ATAC-seq 一般要求 50M 以上比对的 fragments (reads), 因为线粒体 DNA 没有核小体结合,测序出现大量线粒体数据是正常的,线粒体数据占比在 20-80% 都有可能。

    2. 应用
    染色质开放性图谱绘制
    找调控生物学过程的关键转录因子
    找哪个转录因子调控了研究的基因
    找转录因子调控的靶基因
    3. 技术限制
    Tn5通过插入剪断DNA 并将测序接头连接到剪断的两个DNA 片段的末端,因此对于一个DNA 片段而言,其两端的接头连接是随机的,这便导致同一片段两端的接头有50%的概率是同一接头。而只有连接不同接头的片段才可用于富集扩增及测序,因此,有一半的片段无法利用;
    大量剪断的DNA 由于片段过大,无法进行PCR富集;
    Tn5 的活性受反应溶液的组成及反应条件影响,仍然需要优化以便提高剪切效果;
    ATAC-seq在植物细胞中存在以下难点:细胞壁的存在,叶绿体、线粒体等细胞器的污染,缺少稳定遗传的细胞系;

    相关文章

      网友评论

        本文标题:ATAC-seq(1) -- 实验原理

        本文链接:https://www.haomeiwen.com/subject/rrypbrtx.html