美文网首页甲基化统计和算法
BS-Seq在比对过程中的原理

BS-Seq在比对过程中的原理

作者: 桁_COLA | 来源:发表于2019-09-29 17:48 被阅读0次

Bisulfite Conversion

重硫酸盐法-转换

这里我们注意3种DNA链:

1、Watson链和Crick链(名字不代表任何意义 仅用于区分互补的两条链)

【这两条链均为原始DNA链 未经处理 但已有待测的5mC】

3、BSW链(或者BSC链):这两条链分别对应Watson链和Crick中 碱基的转换为“未甲基化的C-T”

4、BSWR链(或者BSCR链):同理 因此碱基的转换为“G-A”

接下来看BISMARK是如何比对的

【首先我们要明确 因为处理后得到了四条链 这里是不能像RNA-seq一样直接进行比对的】

一种方法 比对

将所有的C-to-T(包括reads和ref)

这一步的意义在于:

1、对于reads来说,此时reads上所有的存在(而待转换的)C均带有甲基,此时将这些C转换为T是为了下一步与经过同样转换的ref相比对

2、对于ref来说,将所有的C人为地转为T是为了模拟重亚硫酸盐的处理,且假设所有的C均未甲基化。

这样,我们得到的ref和reads在序列上就完全一样了 我们也就能够得知每一个测序片段是来自原始的两条链中的哪一个,在知道了这个后,我们再将reads上转换过的C-to-T换回T-to-C,就能得出5-mC了。

BSMAP是如何比对的呢?

另一种处理方法

这一步的灵魂在于:create multiple versions of reference seed with C’s converted to T’s

这一灵魂操作的内在意义是:由于我们不知道被甲基化修饰的C是原始ref链上的哪一个,因此我们假设每一个C都有可能是5mC,于是对它进行C-to-T的处理,然后再和真正被bisulfite处理的片段进行比对。

【比对的原则是T可以比对为C或T,而C只能比对为C】

C只能比对为C的原因是:我们在灵魂操作的时候选择保留这个C而不人为地转换为T就是因为假设它是被甲基化的。

而T可以比对至C或T的原因是:

1、如果T比对T,即代表该T原为未被甲基化的C,而在bisulfite的处理中转换为了T

2、如果T比对C,即代表该C为甲基化的C

孰优孰劣?

两种计算方法的对比

相关文章

网友评论

    本文标题:BS-Seq在比对过程中的原理

    本文链接:https://www.haomeiwen.com/subject/sztqpctx.html