使用比对工具 BWA-MEM (v. 0.7.12)将来自 DamID-seq 实验的原始读数映射到小鼠 mm10参考基因组。与 DpnII (GATC)限制性片段侧重叠的映射读数的计数通过每千碱基的读数除以片段的长度,每百万个映射读数(RPKM)进行标准化。基于这些归一化计数,计算了 Dam-XX转导样品和相应的仅有 Dam 编码样品之间的 log2倍变化。最后,使用 HMMt 在20kb 内call LAD,HMMt 使用带 t emissions( https://github.com/gui11aume/HMMt )的改进 Baum-Welch 算法对 DamID 信号进行量化。
library(HMMt)
x <- c(rt(1000, df=3), rt(1000, df=3)+1)
# x has a t distribution with a jump at position 1001.
plot(x, type = 'l')
# Check the output of BaumWelchT.
BaumWelchT(x)
# See that it usually finds the transition.
lines(BaumWelchT(x)$ViterbiPath-1, col=2)
注:在分子生物学中,DpnII 限制性内切酶家族是一个限制性内切酶家族,包括来自肺炎双球菌的 DpnII。这些酶识别双链 DNA 非甲基化序列 GATC,并在 G-1之前切割,在 G-1中包含蛋白质的全部长度。
网友评论