美文网首页甲基化统计和算法
BS-Seq在比对过程中的原理

BS-Seq在比对过程中的原理

作者: 桁_COLA | 来源:发表于2019-09-29 17:48 被阅读0次

    Bisulfite Conversion

    重硫酸盐法-转换

    这里我们注意3种DNA链:

    1、Watson链和Crick链(名字不代表任何意义 仅用于区分互补的两条链)

    【这两条链均为原始DNA链 未经处理 但已有待测的5mC】

    3、BSW链(或者BSC链):这两条链分别对应Watson链和Crick中 碱基的转换为“未甲基化的C-T”

    4、BSWR链(或者BSCR链):同理 因此碱基的转换为“G-A”

    接下来看BISMARK是如何比对的

    【首先我们要明确 因为处理后得到了四条链 这里是不能像RNA-seq一样直接进行比对的】

    一种方法 比对

    将所有的C-to-T(包括reads和ref)

    这一步的意义在于:

    1、对于reads来说,此时reads上所有的存在(而待转换的)C均带有甲基,此时将这些C转换为T是为了下一步与经过同样转换的ref相比对

    2、对于ref来说,将所有的C人为地转为T是为了模拟重亚硫酸盐的处理,且假设所有的C均未甲基化。

    这样,我们得到的ref和reads在序列上就完全一样了 我们也就能够得知每一个测序片段是来自原始的两条链中的哪一个,在知道了这个后,我们再将reads上转换过的C-to-T换回T-to-C,就能得出5-mC了。

    BSMAP是如何比对的呢?

    另一种处理方法

    这一步的灵魂在于:create multiple versions of reference seed with C’s converted to T’s

    这一灵魂操作的内在意义是:由于我们不知道被甲基化修饰的C是原始ref链上的哪一个,因此我们假设每一个C都有可能是5mC,于是对它进行C-to-T的处理,然后再和真正被bisulfite处理的片段进行比对。

    【比对的原则是T可以比对为C或T,而C只能比对为C】

    C只能比对为C的原因是:我们在灵魂操作的时候选择保留这个C而不人为地转换为T就是因为假设它是被甲基化的。

    而T可以比对至C或T的原因是:

    1、如果T比对T,即代表该T原为未被甲基化的C,而在bisulfite的处理中转换为了T

    2、如果T比对C,即代表该C为甲基化的C

    孰优孰劣?

    两种计算方法的对比

    相关文章

      网友评论

        本文标题:BS-Seq在比对过程中的原理

        本文链接:https://www.haomeiwen.com/subject/sztqpctx.html