文献
2023
Nature Plants
Uncovering the transcriptional regulatory network involved in boosting wheat regeneration and transformation
研究背景
1-在拟南芥中,通过侧根起始途径在CIM上激活全能性:生长素诱导WOX11 和 WOX12将具有再生能力的细胞转为founder cell,然后,WOX5 和 LBD16 将founder cell转为愈伤组织。
2-除了转录因子,许多表观遗传修饰已被证实参与了拟南芥再生,如H3K27me3、H3K36me3和H3K4me3都已经被证实影响再生过程,DNA甲基转移酶MET1也参与了再生过程的调控。
3-与拟南芥相比,小麦的再生更加困难。在小麦中,授粉后约14 天的未成熟胚可作为外植体,且不同基因型小麦的再生效率不同。目前最容易完成再生的小麦品种是Fielder.
本文亮点
1-作者利用RNA-seq、ATAC-seq以及CUT&TAG技术分析了最容易遗传转化的六倍体小麦品种“Fielder”未成熟胚再生过程的转录水平和染色质状态。
2-发现在再生过程中,生长素诱导了介导细胞命运转变的基因的顺序表达,并与染色质可及性、H3K27me3和H3K4me3状态的变化相协调。
3-构建了小麦再生的转录调控网络(TRN),通过对比小麦和拟南芥的再生过程,发现了DOF转录因子在拟南芥和小麦中表达模式不同。实验验证表明,TaDOF5.6 和TaDOF3.4 是不同小麦品种转化效率的潜在促进剂。
结论01 小麦再生过程转录和表观图谱的描述
Fig 1a
Fig 1b
作者选择了最容易做成遗传转化的小麦品种——Fielder,作为研究材料。取开花后14天收集的未成熟胚的盾片用作再生的外植体,诱导后3d,盾片开始进行细胞分裂并形成愈伤组织,6 d后愈伤组织继续发育并形成突起。诱导12天后,观察到茎尖分生组织的形成。作者测定了该过程了15份转录组(DAI0-3-6-9-12,每个时间点3份重复),8份ATAC-seq(DAI0-3-6-9,每个时间点2份重复),以及3种组蛋白修饰的24份CUT&TAG数据(Fig1a)。
数据有良好的重复性,并反映了再生进程(Fig 1b)。
Fig 1c
Fig 1d
大部分开放染色质区域和组蛋白修饰位于基因间区(Fig 1c).
开放染色质和H3K27ac的信号主要位于转录起始位点(TSS)附近,而H3K27me3和H3K4me3存在于整个基因中(Fig 1d).
Fig 1e
Fig S1d
在再生过程中,共鉴定了40146个差异表达基因(Fig 1e),展示了转录组重编程的程度。
此外,38%的ATAC-seq峰是差异可及的(Fig 1e),而只有一小部分组蛋白修饰峰显示差异标记(Fig S1d)。这表明染色质可及性在小麦再生过程中起着至关重要的作用。
Fig 1f-i
为了研究小麦再生过程中的转录变化,使用K-均值聚类分析将DEGs分成六个簇(Fig 1f),对每一簇的基因做了转录因子富集分析(Fig 1h)和GO富集分析(Fig 1i),以揭示每一簇基因的潜在功能。Fig 1g展示了每一簇的典型再生相关基因表达量。
01 生信分析
主成分分析
差异peak的鉴定及注释
基因邻近的metaplot
基因表达的聚类分析
转录因子富集分析
GO富集分析
结论2-染色质状态改变与基因表达相协调
Fig 2a
为了研究小麦再生过程中转录谱、染色质可及性和组蛋白修饰之间的关系,作者评估了基因的转录水平与各种染色质特征之间的皮尔森相关系数(Fig 2a)。Fig 2a展示了六簇基因的表达量、染色质可及性以及三种组蛋白修饰在再生过程种的变化,每个小图中右上角的数字代表了相应特征和转录水平的皮尔森相关系数。
染色质可及性与所有簇的基因转录变化呈正相关,而H3K27me3在大多数簇(C2、C3、C4和C6)中呈负相关。H3K4me3在C1、C3和C4与转录正相关。在大多数簇中,H3K27ac与转录的相关性较低。
Fig 2b, c
作者定义,如果染色质可及性或组蛋白修饰与转录水平的皮尔森相关系数大于0.7或小于-0.7,则认为染色质可及性或组蛋白修饰可以调节基因表达。在再生过程中,97%的差异表达基因在其启动子或基因区域至少有一个ATAC-seq峰(Fig 2b中ATAC),其中55%受染色质可及性的调节(Fig 2b中ATAC.reg),对于H3K27me3,36%的差异表达基因在启动子或基因区域至少有一个峰,只有11%受H3K27me3调控。
3299个基因受到染色质可及性及H3K27me3修饰的共同调控(Fig 2b, c),其中大约一半属于C3和C4,它们在愈伤组织诱导后期被激活。考虑到C3和C4中的差异表达基因也受H3K4me3调控,作者共确定了1116个受染色质可及性、H3K27me3和H3K4me3调控的差异表达基因。
Fig 2d-e
考虑到C3和C4中的差异表达基因也受H3K4me3调控,作者共确定了1116个受染色质可及性、H3K27me3和H3K4me3调控的差异表达基因。这些基因在生长素信号传导、根发育、分生组织起始和芽系统发育等过程中发挥重要作用(Fig 2d),Fig 2e展示了已知与再生过程相关的几个基因的转录水平、染色质可及性以及组蛋白修饰。以上分析强调了再再生过程中,染色质可及性和组蛋白修饰可以协同调控基因表达。
02 生信分析
相关性的计算
旭日图
GO富集
结论3-生长素促进愈伤组织诱导并与细胞分裂素相互作用
Fig 3a
生长素是植物再生过程的关键激素。在具有再生潜能的细胞中,生长素可以直接激活WOX11的表达,将具有再生潜能的细胞转变为根创始细胞。然后,WOX11可以激活WOX5等基因的表达,促使根创始细胞分裂形成根原基。所以,根据WOX11和WOX5的表达,作者将再生过程分成了根创始细胞的形成(DAI3)和根原基的形成(DAI6、9、12)两个阶段(Fig 3a)。
根创始细胞的形成需要大量的局部生长素,这可能是由生长素运输基因(如TaABCB1、TaABCB3和TaLAX1)的表达所促进的。生长素信号对刺激根原基的形成和维持也至关重要,作者观察到的生长素信号通路相关基因(如TaTIR1、TaIAA3和TaARF5)的激活支持了这一点。
Fig 3b, c
生长素信号通路的转录调控依赖于生长素响应因子(ARF),ARF能够与生长素响应基因的顺式作用元件(AuxRE)结合进而调控相关基因表达。接下来,作者想知道生长素信号,特别是ARF,是如何参与小麦再生的。
确定ARF靶基因的两个指标:1、基因启动子或基因区域的ATAC-seq peak包含ARF结合基序(AuxRE);2、施加生长素后表达上调(位于C2-C6中的任何一组)。
共鉴定出9471个与生长素信号通路、细胞周期和芽部发育相关的靶基因(Fig 3b),可以分成三组:第一组包括已知参与植物再生的基因,如分生组织识别基因TaWOX5、TaBBM、TaSCR和细胞周期相关基因,表明生长素信号在驱动愈伤组织诱导过程中的作用;第二组基因与细胞分裂素相关,包括TaIPT2、TaAHK3和TaARR10等,这表明生长素信号可以激活细胞分裂素途径,从而启动随后的器官分化;第三组基因包括生长素合成基因TaYUC3、转运基因TaPIN1和生长素F-BOX蛋白5 (TaAFB5)信号通路基因。
因此,在小麦再生的不同阶段,ARFs可能在维持生长素浓度和信号传导平衡中发挥作用。
Fig 3d, e
ARF的靶基因中包含许多与细胞分裂素相关的基因,细胞分裂素信号转导途径包含多种蛋白质,包括B型ARR,已经被证实参与调控拟南芥离体苗再生。通过ChromVar评估,B型ARR结合基序的活性在DAI 6时显著升高(Fig 3d),用类似前面提到的方法鉴定了2924个B型ARR的潜在靶基因,这些基因包括参与根发育的TaWOX5和TaLBD13。
并且,一些参与生长素运输和信号传导的基因,如TaPIN1和TaARF10,同时受到B-ARR和ARF的调节(图3e),表明生长素和细胞分裂素信号传导之间存在串扰。
03 生信分析
转录因子靶基因的鉴定
motif活性
结论4-构建转录调控网络TRN
Fig 4a
为了构建转录因子和靶基因的对应关系,作者利用ATAC-seq数据进行了足迹(footprints)分析。所谓ATAC-seq足迹,即转录因子与DNA结合,从而阻止Tn5在结合位点切割,所以形成了一个被保护的区域,反映在比对上,会形成一个低覆盖度的区域。
参与植物再生的已知调节因子,如LEC2、DOF5.6、WOX11和BBM,其转录因子足迹的染色质可及性在再生过程中发生了显著变化(Fig 4a),表明它们具有潜在的功能重要性。
Fig S4a
Fig 4b
基于以下三个标准构建了该转录调控网络:1、TF与靶基因存在调控关系;2、TF与靶基因共表达;3、只考虑六个cluster中可以显著富集到的转录因子(Fig S4a和Fig 4b)。其中1是根据ATAC-seq鉴定到的足迹,利用拟南芥中已知的TF调控motif来初步确定TF与靶基因的调控,2是根据表达对1根据序列得到的结果进一步筛选,3是为了构建再生过程的核心调控关系。
最终,得到一个包含31,272个节点和8,856,326条边的网络,其中有1,766个转录因子。
04 生信分析
ATAC-seq足迹鉴定
转录因子靶基因鉴定
转录因子富集分析
结论5-利用转录调控网络TRN发掘核心转录因子
Fig 4c, d
Fig S4h
为了确定基因表达的时间顺序,我们进行了伪时间分析。不同簇的时间序列表达模式清晰,顺序为C1-C5-C6-C2-C3-C4(Fig 4c), 然后生成一个集群内的监管网络,以探索不同集群之间的监管关系(Fig 4d)。
在DAI 0特异性高表达的C1与其他簇之间没有调节关系,进一步强调了生长素处理的作用。C5-C6-C2-C3-C4集群之间的调控关系遵循基因表达的时间轴,作者推测两种不同的调控模式共存驱动小麦再生(Fig S4h):第一类指每个簇中的基因受同一簇中的TF调控,第二类指后表达簇中的基因受前表达簇中的TF调控。
Fig 4f
Fig 4g, h
结合这两种调控模式,作者确定了446个核心转录因子,它们要么富集于其自身集群的靶基因上游(I型调控模式),要么在下一簇靶基因上游富集(II型调控模式)。
其中AP2、ERF、HD-ZIP、DOF、G2-like和NAC家族富集(Fig 4f), 40个转录因子是在拟南芥中功能性测试的再生因子的同源物(Fig 4g) ,并且这些基因在小麦再生过程中表现出顺序调控(Fig 4h),如TaWOX11、TaDOF5.6和TaWIND3先被激活,然后再激活TaBBM、TaAIL5和TaSCR来促进愈伤组织的形成。
Fig S6a
Fig S6b
Fig S6c, d
进一步,作者使用来自12个小麦品种的已发表表型和基因型数据来评估位于446个核心TF的启动子和基因区域的DNA变异对再生效率的影响。三个基因的DNA变异与愈伤组织分化率呈显著相关,其中,WOX基因开放染色质区域内的单核苷酸多态性与12个品种间愈伤组织分化差异显著相关(Fig S6c,d)。
这些结果表明,来自TRN核心TFs的因素可能导致小麦品种间再生效率的差异。
05 生信分析
伪时间分析
转录因子富集分析
结论6-小麦和拟南芥诱导愈伤过程的比较
Fig 5a, b
由于驱动再生的核心TRN在小麦和拟南芥中含有保守的TFs,我们比较了这两个物种的过程,特别是愈伤组织诱导。对每个物种的不同阶段进行了差异表达分析,并从DEG中鉴定了同源基因。根据有无同源基因以及差异表达情况,可以分成三组(Fig 5a):group1即物种特异性的DEG,group2即在某一物种中是DEG但是在另一物种中不表达或者不差异表达的基因,group3即在某物种中差异表达并且在另一个物种的同源基因也差异表达。
为了进行比较,重点研究了group3,利用物种内Z-score标准化基因表达和染色质可及性谱,然后进行了聚类(Fig 5b),尽管使用的外植体不同,小麦为未成熟胚,拟南芥为下胚轴,但愈伤组织诱导过程是保守的,这一点可以从两个物种之间同一诱导阶段的样品比同一物种内不同诱导阶段的样品更相似的事实中得到证明(Fig 5b)。
Fig 5c
许多已知参与再生的基因,如BBM、SHR、REV、AIL5和激素相关基因AHK4、PIN1、ARF5和ARR12,在小麦和拟南芥的愈伤组织形成过程中表现出相似的表达模式(Fig5c)。
然而,一些再生因子在两个物种中表现出不同的表达模式,如LBD17和ANAC011(Fig5c)。因此,虽然同源基因参与了小麦和拟南芥的早期再生过程,但可能存在物种特异性表达模式和转录调控途径。
Fig 5d
Fig 5e
根据表达模式的相关性,将同源基因分为两类:表达模式相似或不同的同源基因。基因。达模式的相似性或差异与同源物近端区域的染色质可及性密切相关(Fig5d)。为了深入了解这两类基因,作者在c1-c6的同源基因中进行了over-representation analysis (Fig5e),具有相似表达模式的同源基因主要富集在C1和C6中。
Fig 5f, g
具有不同表达模式的同源基因在愈伤组织诱导早期被生长素短暂诱导的C5中被发现丰富,C5主要富集DOF 和 G2-like家族 (Fig 5f),例如,DOF5.6在小麦愈伤组织诱导早期表达水平上调,而在拟南芥愈伤组织诱导后期表达水平上调 (Fig 5g)
Fig S7d
Fig S7g
为了拟南芥和小麦更好的对比,作者也对拟南芥的转录组做了K均聚类(Fig S7d),并确定了拟南芥中的A3簇和小麦的C5簇表达类似。然而,与DOF家族在小麦C5中富集不同,LBD和NAC家族在拟南芥簇A3中富集(Fig S7g).
小麦和拟南芥在愈伤组织诱导早期所观察到的差异可能是由于所使用外植体的种特异性造成的。之前的研究发现,LBD和NAC在拟南芥再生中发挥重要作用,所以DOF和G2-like对小麦再生的影响值得进一步研究。
06 生信分析
基因的聚类分析
基因功能富集分析
结论7-转录因子DOF提高了小麦的再生效率
Fig 6a
Fig 6b, c
文章的最后一部分,作者探究了DOF转录因子对再生的影响。小麦中, 生长素处理后TaDOF5.6和TaDOF3.4的表达水平上调最为显著(DAI 3),同时H3K27me3被去除 (Fig6a),并且TaDOF5.6和TaDOF3.4属于前面鉴定到的446个核心转录因子,因此选择这两个基因用于后续验证。
对小麦品种Fielder的未成熟胚胎进行的TaDOF5.6和TaDOF3.4 的共转(Fig 6b),发现与GUS阴性对照相比,愈伤组织诱导效率和转化效率均有显著提高。
Fig 6d, e
与GUS相比,转化TaDOF5.6和TaDOF3.4的愈伤组织诱导效率分别从52%提高到88%和85%(Fig 6d),在相同处理下,转化效率分别从26%提高到50%和55% (Fig 6e).
把小麦品种扩展到JM22 和 KN199,也能发现明显的再生能力提升(Fig6d, e),上述结果表明,TaDOF5.6和TaDOF3.4可以提高不同小麦品种的转化效率。
Fig 6f
Fig 6g
Fig 6h
有研究发现DOF3.4可以通过激活细胞增殖基因参与再生。在我们的TRN中,TaDOF5.6和TaDOF3.4可以直接调节与根和茎分生组织形成相关的基因,如LBDs、YABs和SCL2的表达提高小麦的再生效率。
原位杂交证实,TaDOF5.6仅在DAI 3的原形成层区表达,而TaDOF3.4在DAI 3的表皮下三到四层、DAI 6的愈伤组织和DAI 9的芽原基的中表达(Fig 6f)。
随后,从转化的TaDOF5.6、TaDOF3.4和GUS对照中收集材料,我们发现与GUS相比,TaLBD4和TaSCL27在TaDOF3.4或TaDOF5.6转化的组织中表达水平更高(Fig 6g), 转录报告基因实验进一步验证了TaDOF3.4对TaLBD4和TaSCL27的调控作用(Fig 6h)。
综上,TaDOF5.6和TaDOF3.4可以作为小麦转化的新型促进剂来提高转化效率。
本文使用 文章同步助手 同步
欢迎关注微信公众号“我与生信”,定期分享生信相关文献,并分享文献中生信分析技能。
网友评论