美文网首页生物信息学与算法生物信息杂谈生物信息
Maf文件中突变起始位点与终止位点的关系

Maf文件中突变起始位点与终止位点的关系

作者: 王诗翔 | 来源:发表于2018-05-16 16:28 被阅读7次

    在TCGA下载的都是标准的Maf文件,但有时我们会需要使用某篇文章或者某些数据构建Maf文件,然后利用像Maftools这样的工具进行分析和可视化突变。

    如果你知道突变的起始位置,突变参考碱基序列,突变后的序列,我们可以用类似下面的代码来计算终止位点:

    library(tidyverse)
    input_maf %>% 
        mutate(End_Position = ifelse( Reference_Allele == '-', 
                                      Start_Position + 1,
                                      ifelse(Tumor_Seq_Allele2 == '-', 
                                             Start_Position + nchar(Reference_Allele) - 1, 
                                             Start_Position)))
    

    在参考位点或者突变位点中,-用来表示缺失或插入。

    该代码执行这样一个计算变换:

    替换 End = Start
    插入 End = Start + 1 # 不管插入了多少个
    删除 End = Start + n(删除碱基数) - 1
    

    相关文章

      网友评论

        本文标题:Maf文件中突变起始位点与终止位点的关系

        本文链接:https://www.haomeiwen.com/subject/gvzpdftx.html