Bisulfite Conversion
重硫酸盐法-转换这里我们注意3种DNA链:
1、Watson链和Crick链(名字不代表任何意义 仅用于区分互补的两条链)
【这两条链均为原始DNA链 未经处理 但已有待测的5mC】
3、BSW链(或者BSC链):这两条链分别对应Watson链和Crick中 碱基的转换为“未甲基化的C-T”
4、BSWR链(或者BSCR链):同理 因此碱基的转换为“G-A”
接下来看BISMARK是如何比对的
【首先我们要明确 因为处理后得到了四条链 这里是不能像RNA-seq一样直接进行比对的】
一种方法 比对将所有的C-to-T(包括reads和ref)
这一步的意义在于:
1、对于reads来说,此时reads上所有的存在(而待转换的)C均带有甲基,此时将这些C转换为T是为了下一步与经过同样转换的ref相比对
2、对于ref来说,将所有的C人为地转为T是为了模拟重亚硫酸盐的处理,且假设所有的C均未甲基化。
这样,我们得到的ref和reads在序列上就完全一样了 我们也就能够得知每一个测序片段是来自原始的两条链中的哪一个,在知道了这个后,我们再将reads上转换过的C-to-T换回T-to-C,就能得出5-mC了。
BSMAP是如何比对的呢?
另一种处理方法这一步的灵魂在于:create multiple versions of reference seed with C’s converted to T’s
这一灵魂操作的内在意义是:由于我们不知道被甲基化修饰的C是原始ref链上的哪一个,因此我们假设每一个C都有可能是5mC,于是对它进行C-to-T的处理,然后再和真正被bisulfite处理的片段进行比对。
【比对的原则是T可以比对为C或T,而C只能比对为C】
C只能比对为C的原因是:我们在灵魂操作的时候选择保留这个C而不人为地转换为T就是因为假设它是被甲基化的。
而T可以比对至C或T的原因是:
1、如果T比对T,即代表该T原为未被甲基化的C,而在bisulfite的处理中转换为了T
2、如果T比对C,即代表该C为甲基化的C
网友评论