文献
2019
PNAS
Comparative transcriptomics method to infer gene coexpression networks and its applications to maize and rice leaf transcriptomes

研究背景
在不同处理条件下获得的转录组数据可以揭示条件特异性反应的差异表达基因。
在不同时间点获得的转录组数据可以揭示某过程随时间的动态调控。
这样的三维数据(基因表达-处理条件-时间序列)对于研究基因调控网络以及生物学过程非常有用,但是仍然没有一种合适的方法可以处理这种三维数据。
本文亮点
作者提出了时间序列基因共表达网络( time-ordered gene coexpression network, TO-GCN)来处理这种三维数据。
01 实验材料和转录组数据处理
Fig S1a
作者利用13个在LD下的玉米转录组数据和12个在全暗(TD)条件下的转录组,LD和TD共用一组T0数据(Fig S1a)。可以看到相同时间的TD和LD还是有很大差异的。这样就构建了一个包含25份数据的三维转录组数据集,三维指的是光照情况,发育时间以及不同的基因。
基因的表达量作者用RPKM表征,并且后续只分析至少在两份数据中RPKM>1的基因,也就是去除了那些在这个范围内基本不表达的死基因。剩余25489个基因用于后续分析,其中包括1718个转录因子。
02 构建时间序列基因共表达网络
Fig 1a
分析这种不同条件下的时序数据存在一个主要的问题是不同的条件下基因表达模式会改变以应对不同的条件。比如在这篇文章中,胚胎叶在TD条件下的最初发育速度明显比LD条件下更快,也就是说TD下的基因表达谱可能与LD大体相似,但是可能表现出时间偏移,因此,当比较从不同条件获取的两组时间序列转录本时,考虑时间偏移效应是很重要的。
为了满足这一点,作者给出的流程首先分别考虑每组时间序列转录本上的基因共表达,也就是先单独看LD下的基因共表达情况,再单独看TD基因的共表达情况,然后比较LD和TD下的共表达模式(Fig 1a)。这样考虑两个条件的共表达一共有9种情况,LD条件下正的共表达,TD下正共表达、负共表达或者不共表达,或者LD条件下负的共表达,依此类推。LD和TD下均不共表达的情况去除,后面只考虑前八种情况。然后对这八种情况分别构建基因共表达网络(GCN)。
Fig 1b
由于选用的是时间序列数据,所以构建共表达网络之后,可以根据随时间的表达量变化得到每个阶段有哪些基因或者转录因子在发挥作用,构建一系列的时序网络 (Fig 1b)。
03 利用TOGCN揭示生物学过程
Fig 2a-c
在八种网络中,LD+TD+表示在LD和TD下均表现出正的共表达的基因,均共表达说明光照和黑暗并没有影响它们的潜在的调控关系,也就说这些基因是与光照无关的。下面这个网络图就是作者给出的LD+TD+网络的时间序列分布。根据表达量变化,一共可以分成L1-15 15个level (Fig 2a).
BC的热图展示了在LD和TD下每个level的基因的表达量,它们的表达量存在一个连续性的变化。
Fig 2d
对每个level的基因做了功能富集,发现L8和L9存在明显的功能转换 (Fig 2d)。在前八个level始终可以富集到泛素化介导的蛋白质降解功能。与L1-L8相比,L9-L15的基因主要与细胞增殖相关,在最后四个阶段,也出现了与光合作用相关的功能,这可以说明即使在完全黑暗的情况下,玉米胚叶细胞也被编程为 能够进行光合作用的细胞。
Fig 2e
另外,植物激素对于触发发育的重编程是必不可少的,作者发现与ABA相关的基因倾向出现在前三个level,随后逐渐减少,这与ABA维持种子休眠直到萌发开始的功能一致(Fig 2e)。与ABA相比,赤霉素相关基因大多出现在L2和L3,这与赤霉素在诱导萌发过程中与ABA拮抗一致。大多数生长素和细胞分裂素相关基因分别出现在L9-L15和L10-L13,跟这两种激素共同在调节细胞增殖和分化作用相关。
Fig 3
之前的研究发现C4植物的花环结构无论在光下还是在暗中都能完成正常的发育,所以作者推测花环结构的形成与光照无关。文章的最后作者就是用LD+TD+这个网络去找一些与花环结构形成相关的基因和转录因子。
ZmSHR1基因已经被证明在玉米的花环结构形成过程发挥重要作用,它的上游调控仍不是很清楚,ZmSHR1的表达活跃出现在L11,它的上游调控应该出现在L11以及L11之前的level (Fig3)。这个转录因子的共表达网络中有红色黄色和蓝色的圈,黄色的圈代表该转录因子没有已知的转录因子结合位点,蓝色的圈代表该转录因子存在已知的转录因子结合位点。红色的圈代表这个转录因子的启动子区域存在调控它的转录因子的结合位点。提取了红色的转录因子构建了这个通路用于后续验证。
但是这个关系是通过基因间的共表达来建立的,它们之间的连线只能代表两基因有共表达关系,而不能直接说明有直接的调控。所以进一步作者又根据转录因子结合位点来预测两基因之间的调控关系,根据转录因子结合位点可以推测前两个基因存在某种调控。最后作者又根据EMSA实验和PTA实验证明了棕红色箭头指示的调控关系,与共表达的结果基本符合。
总结
时间序列转录组对于鉴定生物过程的调控因子非常有用。
为了分析这类数据,作者开发了一种避免两个条件之间的时间点对齐和标准化的方法。将其应用于分析在光-暗循环和完全黑暗条件下发育中的玉米叶片的时间序列转录组,并获得了一个按时间顺序排列的基因共表达网络(TO-GCN),该网络很可能包括参与Kranz解剖结构发育的所有基因,这种结构对于C4光合作用的高效率至关重要。利用这个TO-GCN,作者预测并通过实验证实了Kranz解剖结构发育的一个调控级联。
本文使用 文章同步助手 同步
网友评论