首先利用mega进行多序列(clustalw)比对然后用最大似然法建树
树文件另存为*.nwk
clustalw结果另存为fas结尾的fasta格式文件
利用ggtree进行可视化
library(ggtree)
tree <- read.tree("tree.nwk") # 读入树文件
p1 <- ggtree(tree) +
geom_tiplab(size = 4) + # 加物种名称
geom_treescale(fontsize=4, linesize=0.5) + # 加标尺
geom_nodelab() + # 加bootstrap值
xlim(0,15) #物种名字太长,调整x轴范围至完全显示
p1
msaplot(p1, "clustalw.fas",
offset = 4)
msaplot(p1, "clustalw.fas",
offset = 4,
window = c(100, 120)) # window指定可视化范围,即序列长度范围
image.png
image.png
这里蛋白序列,种类比较多,所以不如核酸序列信息简洁明了。
其实真想看保守序列还是把多序列比对后的结果上传到espript3上吧,结果清晰明了
网友评论