如果想做植物的转录因子调控网络,我们可能会有以下问题。
- 1:如何利用有限的叶片原生质体材料获得高质量的TF ChIP-seq数据?
- 2:如何生成可信的无标度转录调控网络图?
- 3:整体网络和局部网络的关系,以及如何根据局部网络模块- 化确定潜在的调控因子功能?
- 4:TF 共结合有什么作用?
- 5:同系跨物种间TF调控作用存在什么样的关系?
我们以玉米为例,介绍构建TF调控网络的详细方法。
文献:Reconstructingthe maize leaf regulatory network using ChIP-seq data of 104 transcriptionfactors
真核细胞内的转录调控网络,是由转录因子(TFs)的组合作用所决定的。但是,植物中的TF结合研究的数量太少,无法给出这个复杂网络的全貌。
本研究以玉米为模型,对玉米叶片中表达的104种TF进行ChIP-seq,重建其转录调控网络,并训练机器学习模型来预测TF结合和共定位。
具体研究
1. 如何利用有限的****玉米叶片原生质体****材料获得高质量的TF ChIP-seq数据?
作者开发了一种高效的玉米原生质体分离和转化系统(图1a),成功对104个在玉米叶片发育切片上表达的TFs进行了ChIP-seq实验。然后应用ENCODE2统一pipeline来处理,总共得到了217个ChIP-seq数据,2,147,346个可重复的TF结合peak。
验证发现,TF结合形成密集的cluster并定位在开放的染色质区域(图1b-d)。使用GO-term和MAPMAN功能类别富集分析,来根据靶基因对其进行分类(图1e)。大部分的TFs被分为信号传导、激素、光合作用和代谢类,这些都是叶子的核心生物功能。
此外,作者观察到尽管一半以上的TF结合位点位于基因5'的近端区域,但远侧的TF结合位点(如Vgt1)也显示出相似的染色质特征,并可能在调节转录中发挥重要作用(图2)。
2. 如何生成可信的无标度转录调控网络图?
接下来,使用ENCODE TIP概率框架构建了一个基因调控网络,使用该TIP模型,生成了一个具有272,627条边和20,179个节点的网络图(约45%的注释基因和约77%的叶子表达基因)(图3a)。
3. 整体网络和局部网络的关系,以及如何根据局部网络模块化确定潜在的调控因子功能?
生物网络通常表现出拓扑和/或功能模块化。应用分区算法(Gephi version 0.92)来确定网络元素子集之间的关系,发现网络可以被划分为七个模块(分辨率1.0)。每个模块包含约27 - 5%的节点。这些模块并不是孤立的,大约40%的边缘出现在每个模块内,说明TFs可以调节自身模块外的基因,模块之间存在大量的信息流。接下来,对每个模块中的基因进行GOterm和MapMan功能富集分析,发现它们确实针对特定功能富集。
然而,每个模块包含数千个具有不同功能的基因,而且太大而不能作为一个整体进行评估。假设:由于该网络已经能够在这个尺度上提供生物学功能的线索,因此可以根据局部规模的连通性来确定更小通路的潜在调控因子。
验证
首先,在保守的叶绿素生物合成通路中测试了这一点。已知该通路受GLK TFs的调控,因为它们的突变会破坏光合作用基因的表达。为了推断每个TF对给定通路的贡献,用ENCODE TIP概率模型为每个TFtarget相互作用计算了对数转换后的p值的总和(图4a)。发现,叶绿素生物合成通路的主要转录因子确实是两个GLKs和一个未知的MYBR26。尽管尚未在玉米中研究MYBR26的功能,但其拟南芥同源物参与了昼夜节律调节,进一步证实了假设。
接下来,使用这种策略来检查缺乏预先定义调控子的玉米C4光合作用通路。结果表明,**连通性排名前5位的TFs均为constant -
like(COL)TFs**(图5b,c)。之前其他植物的研究表明,COLs在花期和光周期的调节中发挥着重要作用。纯合突变体具有浅绿色和幼苗致死性表型,支持作者的假设,即COL TF对光合作用很重要(图5d)。
有趣的是,对于在叶肉或束鞘细胞中特异性表达的关键C4光合作用基因,作者发现,它们的基因位点与细胞特异性H3K27me3标记相关。这表明,它们不仅受到复杂的TF网络的调控,而且在表观基因组水平上也受到调控(图5e)。
4. TF 共结合有什么作用?
利用来自于共定位模型的规则,在给定背景下作者对每个partner TF的相对重要性进行了评分,以反映peak集的联合分布(图6 d)。
为了从模型结果中获得全局视图,作者计算了所有focus-TF的TF的平均RI。观察到,整个集合显示出一个平均RI值趋于中低(即≤60RI,上下文相关性更高)的趋势,较少的TF可以预测大量的focus-TF(即> 60 RI,高组合潜力)。例如,在104个TFs中, LATE ELONGATED HYPOCOTYL (LHY) 在分化叶截面中表达最高。LHY编码一个MYB TF,它是植物生物钟中的中心振子,基于RI预测的前三位伙伴TFs是ZIM18、bHLH172和COL7(图6e)。
尽管它们的功能尚未在玉米中鉴定,但它们的拟南芥同源物分别与茉莉酸信号,铁稳态和开花时间调节有关,所有这些都与昼夜节律紧密相关。
作者的发现证实,共结合可能是解释具有相似序列偏好的TF如何靶向不同基因并控制不同生物学功能的关键。共定位模型还揭示了TF结合位点的组合空间很大,这可能有利于特定组合的出现,从而促进了物种形成过程中调控网络的快速多样化。
5. 同系跨物种间TF调控作用存在什么样的关系?
接下来,作者研究禾本科的转录调控网络是如何进化的。作者在高粱和水稻中进行了ATAC-seq,并获得了其同系玉米基因的开放染色质序列。然后,根据玉米TF的模型是否可以预测高粱和水稻中共同目标基因的开放染色质中的结合,来推断网络边缘保守性(图7a)。例如,作者在高粱中68%的同系开放染色质区域中发现了预测的TF结合事件。从同系TF到同系基因的预测网络边缘来看,作者推断玉米网络中约28%的边缘在高粱中是保守的,而约19%在水稻中是保守的(图7b)。
为了在植物中测试同源TF识别位点之间的强相关性,作者计算了玉米,高粱和水稻的开放染色质区域中每个TF模型的匹配数,发现它们确实相关(图7d)。此外,每个玉米TF在水稻和高粱中发现的保守靶点数量也存在相关性(图7e),表明在动植物进化过程中存在相似的选择压力。
网友评论