前一篇推送介绍了马铃薯在冷胁迫后的染色质可及性和组蛋白修饰的转变。在组蛋白修饰中重点关注了H3K4me3和H3K27me3两种,其中K4通常认为是激活型组蛋白修饰,K27通常被认为是抑制型组蛋白修饰。某些染色质区域,两者可以共同存在。
什么是二价性染色质
2006年,Lander 和 Fisher 在胚胎干细胞中发现了一类同时存在激活型组蛋白修饰和抑制型组蛋白修饰的基因,它们处于一种蓄势待发的平衡状态。H3K4me3 和 H3K27me3 重叠的模式被称为“二价染色质(bivalent chromatin)”。“蓄势待发的(poised)”基因的二价特征的发现是出乎意料且非常重要的。它提供了第一个关于“中间”状态的线索,其中二价标记的基因可以在发育过程中分解为活性或非活性状态。
二价染色质不是胚胎干细胞特异性的,在其他细胞类型中也有详细的记录。在拟南芥的精细胞和茎间分生组织中也观察到类似的潜在染色质二价性,推测染色质二价性可能是具有潜在多能性植物细胞的共同特征,
如何定义二价性染色质/基因
01 基于双重ChIP-seq
Zeng, Zixian et al. Genome biology. 2019. doi:10.1186/s13059-019-1731-2
马铃薯GB 文章中对二价性基因的定义:使用sequential ChIP-seq技术,第一组先拉K4再拉K27(K4-K27),第二组先拉K27再拉K4(K27-K4),然后用两组的信号去量化基因的二价性信号,只有当冷处理块茎后K4-K27和K27-K4同时增加的基因才用于二价性基因的分析。
上图是作者在方法部分的描述,有几点不清楚。
1、如何定义基因的范围,启动子+genebody?仅genebody?仅启动子?启动子定义成多长?考虑转录终止位点下游吗?
2、“increased level”如何定义,绝对变化还是fold change?
文章正文部分也没有更明确的介绍,作者也没有上传原始代码,所以以上亮点我无法解决。
02 分别基于K4和K27的ChIP-seq
上面的定义方法是今年吴柘团队发表的精细胞二价性的文章,之前的推送有分享,链接为文献解读:NG-拟南芥雄配子发生过程的染色质特征
作者在github给出了分析代码,可以学习他们是如何定义二价性基因的。
(1) Find the bivalent peaks in Spm (homer: mergePeaks) 是利用K4和K27的peak拿到merge后的peak,这里的merge是对存在交集的K4和K27取并集。
(2)第二步是利用annotatePeaks.pl对peak进行注释,可以关联到附近的基因。
该脚本第一步先找到距离该peak最近的TSS,并将该峰分配给该基因。第二步确定该峰的中心位置所占的基因组区间特征作为注释结果,具体原理见上图。
输出文件的第八列是该peak中心位置所占基因组特征,作者去除了Intergenic项,只分析其他项。
上述两种定义方法都成功发发表,说明都可信。个人感觉第一种方法,通过sequential ChIP-seq技术同时检测K4和K27区域更准确,第二种方法是分别做了K4和K27的ChIP-seq然后根据两者的重叠性再去鉴定peak,有可能存在上述情况,即不是严格的二价性基因。但是从实验角度,方法2是针对单个细胞类型做的ChIP-seq,可能对于低起始量细胞做两次ChIPs还不够成熟。
网友评论