美文网首页生信比较与进化基因组R统计编程
R语言ggtree+msa可视化进化树+多序列比对的结果

R语言ggtree+msa可视化进化树+多序列比对的结果

作者: 小明的数据分析笔记本 | 来源:发表于2021-11-13 22:20 被阅读0次

    这两天看用vcf文件做单倍型网络的内容,找到了一篇plos one上的论文

    论文题目是

    A workflow with R: Phylogenetic analyses and visualizations using mitochondrial cytochrome b gene sequences

    image.png

    论文提供了完整的R语言代码和示例数据

    里面一小部分内容是关于进化树的可视化展示并且关联多序列比对的结果的。记录下这个代码

    我自己的数据是vcf文件,论文中提供的fasta格式的文件

    读取vcf文件

    library(vcfR)
    
    vcf.example<-read.vcfR("popgenome/KiwifruitPathogenFiltered.recode.vcf")
    df<-vcfR2DNAbin(vcf.example)
    

    做进化树并使用ggtree可视化展示

    library(ggtree)
    library(ape)
    dnbin<-dist.dna(df,model = "K80")
    dnbin
    tree<-nj(dnbin)
    tree
    ggtree(tree,branch.length = "none")+
      geom_tiplab()+
      #theme_tree2()+
      xlim(0,10)
    
    image.png

    关联fasta序列内容

    这里使用到的是msa这个R包

    首先是安装

    BiocManager::install("msa")
    library(msa)
    help(package="msa")
    

    可视化展示

    ggtree(tree)+
      xlim(0,0.1)+
      geom_tiplab(align = T) -> p1
    p1
    njmsaplot<-msaplot(p1, df, 
                       offset = 0.02, 
                       width=1, 
                       height = 0.5, 
                       color = c(rep("rosybrown", 1), 
                                 rep("sienna1", 1), 
                                 rep("lightgoldenrod1", 1), 
                                 rep("lightskyblue1", 1),
                                 "red"))
    
    image.png

    msa这个包是第一次接触,还没有学会其中函数的用法,先知道有这个功能,等到用到的时候再来学习吧

    今天推文的示例数据偏大,运行时间可能会比较长

    欢迎大家关注我的公众号

    小明的数据分析笔记本

    小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

    相关文章

      网友评论

        本文标题:R语言ggtree+msa可视化进化树+多序列比对的结果

        本文链接:https://www.haomeiwen.com/subject/zynzzltx.html