FAIRE-seq

作者: 笺牒九州的怪咖 | 来源:发表于2021-12-08 18:54 被阅读0次

FAIRE-seq
HMMRATAC检测ATAC数据的开放性
通过ATAC-seq和FAIRE-seq研究开放染色质发现驱动体

1.FAIRE简介

甲醛辅助分离调控元件 (Formaldchyde Assisted IsoJation of Regulatory Elements, FAIRE) 是近年来才建立的新技术,最初应用于酵母细胞,后被用于多种细胞,可以和DNase-Seq技术相结合,揭示开放型染色质的特征,是研究DNA 水平调控的优选方法.分子生物学研究表明,在个体发育过程中,用来合成RNA的DNA模板会发生规律性变化,从而调控基因表达和生物体的发育DNA 水平的基因表达调控最重要的途径就是通过“开放”型活性染色质(activechromation)结构.真核生物的活跃转录是在常染色质上进行的.转录发生之前,染色质常常会在特定区域被解螺旋,变为松弛状态,形成自由DNA。生物体通过核小体结构的解体或改变,DNA本身局部结构的变化,从右旋型变为左旋型(Z-DNA)等,使得结构基因暴露,促进转录因子与启动子DNA的结合,从而诱发基因转录。

研究表明,使用 DNase I处理各种组织细胞的染色质时，发现处于活跃状态的基因比非活跃状态的 DNA 更容易被DNase I所降解。鸡成红细胞染色质中,B-血红蛋白基因比卵清蛋白基因更容易被DNase I切割降解。与此相反,鸡输卵管细胞的染色质中被DNaseI优先降解的是卵清蛋白基因,而不是B-血红蛋白基因,研究发现,活跃表达基因所在染色质上一般含有一个或者数个DNase I超敏感位点,它们大多位于基因5’端启动子区域,少数在其他位置。有人用专一切割单链DNA的SI核酸酶处理该基因活跃表达的染色质DNA,证实有DNA被水解,说明该基因活跃表达时启动区部分庁列可能解开成单链,从而不能继续缠绕在核小体上,使启动区DNA 裸露于组蛋白表面,形成了对DNase I的超敏感现象。上述事实充分说明,超敏感位点的存在可能是染色质结构规律性变化的结果。正是由于这种变化,使DNA容易与RNA聚合酶和其他转录调控因子相结合,从而启动基囚表达,同时也更易于被核酸酶所降解。

2.FAIRE的发现过程

FAIRE的发现十分偶然,是在用ChIP-chip技术构建酵母Set1甲基化转移酶复合物的组蛋白甲基化分右图谱的实验中发现的。ChIP 实验中需要对照DNA(INPUT DNA),制备INPUT DNA时,无需对细胞进行甲醛处理和染色质的免疫沉淀,只需将细胞全基因组DNA用酚氯仿抽提制备即可,而在制备INPUT DNA的实验中,研究人员因误操作,将制备INPUT DNA的细胞进行了甲醛交联,但在制备DNA时未进行反交联,而直接用酚氯仿抽提法制备基因组DNA,结果发现所制备的基因组DNA中,相对于非编码区 DNA(non-coding region DNA)而言,编码区DNA(coding region DNA)得到明显富集。这种结果最初被解释为该酵母细胞编码区 DNA含有大量的甲基化核小体,后来在缺少H3K4甲基化的突变体酵母纽胞系中也观察到这种现象。对这一现象的进一步研究,使得Nagy和Lieb在2003年首次报道了该实验方法,该课题组主要关注染色质组装,尤其侧重于研究核小体的动态变化。2007年,他们将这种实验方法正式命名为 FAIRE。

3.FAIRE的原理

FAIRE实验过程包括:细胞或组织培养、甲醛交联、细胞裂解、超声波打断染色质,然后进行酚氯仿抽提制备水相DNA、检测水相DNA.在FAIRE酚氯仿抽提过程中,蛋白未交联的DNA溶于水相,而蛋白结合型DNA留在两相界面,从而把全基因组DNA分为两部分(即水相和有机相DNA),然后对水相DNA 进行检测,常用的检测方法有荧光定量PCR、DNA微阵列芯片、第二代测序技术等,FAIRE样品制备及检测过程如下图所示：

Fig. 1. FAIRE procedure. (A) The FAIRE procedure described in the text is shown on the left, while preparation of the reference or input sample is shown on the right. The DNA recovered from the aqueous phase of each extraction can then be used to identify sites of open chromatin using qPCR, tiling microarrays, or high-throughput sequencing applications. (B) For qPCR, a series of primers, depicted as convergent arrows, are designed to span a genomic region of interest. Sites of open chromatin are highlighted in blue, with qPCR results depicted above. Amplicons that span or are near the boundaries of open chromatin often result in lower relative enrichment due to shearing of DNA fragments, as shown by asterisks. (C) Microarrays. Typically we use high-resolution microarrays that tile either regions of interest or the entire genome of an organism with 50–70 bp oligonucleotides. (D) High-throughput sequencing technologies can be used to map the DNA fragments back to the reference genome.（Ref：Giresi P G, Lieb J D. Isolation of active regulatory elements from eukaryotic chromatin using FAIRE (Formaldehyde Assisted Isolation of Regulatory Elements)[J]. Methods, 2009, 48(3):233-239.）

近年来,FAIRE 与高通量技术结合产生的 FAIRE-Seq 技术,得到了广泛应用.将ChIP-Seq,DNase-Seq和FAIRE-Seq三种实验技术联用,可用于揭示转录因子结合位点、核小体分布位置、染色质开放区域,以及三者之间的关系。三种实验技术的原理如下图所示：

Fig. 2. Comparison of experimental protocols. Experiments to detect different aspects of DNA-binding proteins share many of the same steps; simplified schematics of the main steps are shown. a | Chromatin immunoprecipitation followed by sequencing (ChIP–seq) for DNA-binding proteins such as transcription factors. Recent variations on the standard protocol include using endonuclease digestion instead of sonication (ChIP–exo) to increase the resolution of binding-site detection and to eliminate contaminating DNA, and DNA amplification after ChIP for samples with limited cells. b | ChIP–seq for histone modifications uses micrococcal nuclease (MNase) digestion to fragment DNA and can also now be run on low-quantity samples when combined with the additional post-ChIP amplification. c | DNase–seq relies on digestion by the DNaseI nuclease to identify regions of nucleosome-depleted open chromatin where there are binding sites for all types of factors, but it cannot identify what specific factors are bound. d | Formaldehyde-assisted identification of regulatory elements (FAIRE–seq) similarly identifies nucleosome-depleted regions by extracting fragmented DNA that is not crosslinked to nucleosomes. LinDA, single-tube linear DNA amplification; T7, T7 phage RNA polymerase.（Ref：Furey, Terrence S . ChIP–seq and beyond: new and improved methodologies to detect and characterize protein–DNA interactions[J]. Nature Reviews Genetics, 2012, 13(12):840-852.）

4.FAIRE的下游检测技术

FAIRE的下游检测技术,包括荧光定量PCR，DNA芯片、第二代测序技术，下面简单介绍三种检测方法的原理及步骤.

首先,应明确覆瓦阵列(Tiling array)的含义.Tiling(tile path)指的是如瓦片一样覆盖基因组的探针序列,也可指荧光定量PCR 引物.相对于传统微阵列技术,TilingArray 的设计思路可以说是无偏向性的。针对所选取的染色质区域,无任何偏倚地按着一定的间隔规律、或以序列交叠的方法、或以序列头尾相接的方式制作成探针.将相邻探针中心位置之间的距离定义为探针的步长(step或resolution). 荧光定量 PCR 可用于检测开放染色质位点,也可以用于验证高通量测序结果的有效性.当设计该实验时,需要注意以下方面:须恰当地选择参考对照区域,精确的引物定位,合适的定量方法]。选择恰当的参考区域特别重要,因为在这里我们计算的是相对于其他基因位点的富集程度。对于大多数生物的染色质来说,我们并不确定应该选择哪些位点作为参考位点,即无法确定“参考的金标准”。即使某些细胞已经有了闭合染色质图谱的实验数据,但是或许这些实验数据只适用于特定生长环境条件的细胞.研究人员通常会设计相互重叠或者紧密排列的引物序列扩增待检测的基因区域,另外还需设计一系列阳性和阴性引物。引物设计是获得精确的荧光定量 PCR 结果的关键, 引物扩增产物大小一般为60~100 bp3,4使用相对Ct值法47来计算每个扩增片段的相对富集倍数[7,43],这里的比值即是FAIRE 样品信号与未交联样品信号的比值,然后全部的比值再用最小值进行归一化. 对于芯片实验来说,实验设计是决定其成功与否的关键,也是获得可靠数据的前提。芯片实验设计主要应该考虑以下方面:探针类型、分辨率,覆盖的基因组范围、芯片平台选择等(4,对于 FAIRE 来说,最重要是高分辨率,所谓的分辨率是指一个探针到下一个探针间的基因距离,足够密集分布的探针才能捕获FAIRE 收集的DNA片段(200 bp左右)包含的基因组信息,那么探针之间的最小间隔是多少呢?Simon和Lieb等人的文章1451中提到最小值应该选65 bp 或者每个FAIRE DNA片段有三个探针分布.Giresi和Lieb43提到:寡核苷酸探针长度为50~75 bp的Tiling array,探针之间的间隔尽可能地不超过100 bp(这就使得每个FAIRE 位点的探针数目减少至1~2个.当然也可以根据具体的需要恰当地选择芯片所覆盖的基因组范围,如Eeckhoute 文章(中选取了染色质8.11和12来设计探针. DNA芯片的设计和数据分析主要包括以下四个步骤: (1)芯片制备,采用光导原位合成或者微量点样等方法50,5),将合成的寡核苷酸有序地固定在载体表面,形成储存有大量信息的高密度DNA 微阵列. (2)使用LM-PCR(连接介导PCR)扩增FAIRE和 INPUT DNAL3.32, (3)用T4DNA聚合酶处理DNA片段,使DNA片段的末端成为平末端,之后用T4 DNA连接酶给DNA片段的末端连上不对称的接头,提供对DNA 片段进行PCR扩增的引物结合位点149);最后,用与接头DNA 互补的引物进行PCR扩增. (4)样品标记、杂交反应和信号检测,及数据分析. 大多数寻找峰(peak)的现存算法,都可来识别 FAIRE 富集区域,由于FAIRE和ChIP-chip实验数据获取过程的相似性,这些算法同样适用于ChIP-chip 数据.Simon等人[45在文章中这里推荐ChIPOTle43或Mixer44。Eeckhoute 等人4使用了MAT算法来处理数据.Giresi等人的文章中详细说明了ChIPOTle处理FAIRE 数据的过程5,首先计算四次FAIRE 实验数据的平均值,然后输入到ChIPOTle3,中.对于多重实验,要经过Benjamini-Hochberg校正,选取P值小于10的部分 peak.另外,LeelS和 Oberleyl56)等人在文章中提到多种处理阵列设计的特殊问题及可靠的检测方法。

5.FAIRE seq的具体步骤

(1)按生产商说明,制备测序文库。这里我们推荐100~200 ng的 FAIRE DNA样品.首先使用 Agencourt AMPure XP beads 试剂盒进行两轮纯化与回收,然后进行18个循环的PCR扩增,筛选200-~500bp的DNA建立最终文库。另外,也可以用TruSeq kit(Illumina)试剂盒来制备测序文库。关键步骤:保证至少3×10’读段(reads),才可以确保测序深度和广度

(2)运用诸如TagDust(的算法,通过适配器过滤去除测序序列,清洗文库.我们设定错误发现率为0.001,关键步骤:在清洗文库步骤中,估计会过滤掉大概0.1~0.2%的读段.如果过滤部分高达10%,则说明文库的质量不达标.

(3)使用FASTX-Toolkit 算法(http://hannonlab.cshl.edu/fastx_toolkit/) 来评估文库质量,比如说置信值(confidence score)),核苷酸分布(nucleotide distribution).关键步骤:相对均一的碱基分布非常重要,在每个读段中都保证有四种核苷酸。核苷酸的误用,特殊序列的重复出现和序列质量的不稳定性,都有可能导致测序文库更为复杂以及测序错误增加。

(4)使用诸如Bowtie这样的算法,将高质量的读段映射(mapping)到参考基因组上。大都采取默认参数,可允许的比对数量的最大值限定为4.当有多种比对(alignment)结果存在时,Bowtie算法必定会选择得分最高的比对结果。对于大部分的基因组和实验来说,大约有75~85%的测序读設可以被成功比对.

(5)数据可视化以及寻找发观相对于背景有明显富集的检测区域(使用ZINB算法）.

(6)使用IDR算法来评估交联-折叠相关系数.

6、FAIRE-seq分析软件

F-Seq ：

使用高通量测序技术的标签测序现在经常被用于识别特定的序列特征，如转录因子结合位点(ChIP-seq)或染色质开放区域(DNase-seq)。为了直观地总结和显示单个序列数据作为一个准确的和可解释的信号，我们开发了F-Seq软件包，它可以生成一个连续的标签序列密度估计，允许识别具有生物学意义的站点，其输出可以直接显示在UCSC Genome Browser中。

软件介绍和下载：https://fureylab.web.unc.edu/software/fseq/

目前版本：Version 1.84

----------------------------------------------------------------------------------------------------------------------------------I am a line！-----------------------------------------------------------------------------------------

参考：

Song L , Zhang Z , Grasfeder L L , et al. Open chromatin defined by DNaseI and FAIRE identifies regulatory elements that shape cell-type identity[J]. Genome Research, 2011, 21(10):1757-1767.

Waki H, Nakamura M, Yamauchi T, et al. Global mapping of cell type-specific open chromatin by FAIRE-seq reveals the regulatory role of the NFI family in adipocyte differentiation[J]. Plos Genetics, 2011, 7(10):e1002311.

Furey, Terrence S . ChIP–seq and beyond: new and improved methodologies to detect and characterize protein–DNA interactions[J]. Nature Reviews Genetics, 2012, 13(12):840-852.

Giresi P G, Lieb J D. Isolation of active regulatory elements from eukaryotic chromatin using FAIRE (Formaldehyde Assisted Isolation of Regulatory Elements)[J]. Methods, 2009, 48(3):233-239.

Boyle, A.P., Guinney, J., Crawford, G.E. & Furey, T.S. F-Seq: a feature density estimator for high-throughput sequence tags. Bioinformatics 24,2537–2538 (2008).

FAIRE-seq
1.FAIRE简介甲醛辅助分离调控元件 (FormaldchydeAssistedIsoJationofRegu...
HMMRATAC检测ATAC数据的开放性
背景目前，已经衍生出多种用于检测染色质开放性的试验方法。比如， DNase-seq， FAIRE-seq和ATA...
通过ATAC-seq和FAIRE-seq研究开放染色质发现驱动体
Davie K, Jacobs J, Atkins M, Potier D, Christiaens V, Hal...

FAIRE-seq

1.FAIRE简介

2.FAIRE的发现过程

3.FAIRE的原理

4.FAIRE的下游检测技术

5.FAIRE seq的具体步骤

6、FAIRE-seq分析软件

相关文章

FAIRE-seq

HMMRATAC检测ATAC数据的开放性

通过ATAC-seq和FAIRE-seq研究开放染色质发现驱动体

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

【高通量测序（NGS）原理】

美文共赏

试读