系统进化树的构建

作者: Htt_1996 | 来源:发表于2020-07-19 15:11 被阅读0次

一、多物种某基因家族的氨基酸序列fasta文件的准备(此例为yth基因家族)

1.已鉴定物种的某基因家族文件的获取

HMM文件准备

image.png

未知某基因家族的物种的genome DNA和氨基酸序列下载(即基因家族分析物种)

  • NCBI
    箭头分别选择Genome和输入物种的拉丁学名


    image.png

    按箭头下载文件(下载氨基酸序列就可以,protein)


    image.png

2、利用Hummer和blast+找同源基因

Liunx系统下

hmmer

  • hmmer下载及安装
mkdir 5.biogenefamily
cd 5.biogenefamily/;ls
wget http://eddylab.org/software/hmmer/hmmer.tar.gz 
tar zxf hmmer.tar.gz 
ls
cd hmmer-3.3/;ls
./configure 
make
make check
ls
cd src/;ls
vim ~/.bashrc
source ~/.bashrc
hmmsearch -h
wget http://pfam.xfam.org/family/PF04146/hmm ##下载Hmm文件
mv hmm yth.hmm
wget https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/001/635/GCF_000001635.26_GRCm38.p6/GCF_000001635.26_GRCm38.p6_protein.faa.gz 
#下载物种氨基酸序列文件

hmmsearch -o ./yth_simp_hmm.txt yth.hmm zea_simp.fasta
ls
cat zea_yth_hmm.txt 
moere zea_yth_hmm.txt 
more zea_yth_hmm.txt 

Blast+

wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.2.30+-x64-linux.tar.gz
tar -zxvf ncbi-blast-2.2.30+-x64-linux.tar.gz
wget https://github.com/weizhongli/cdhit/archive/V4.6.2.tar.gz
gunzip V4.6.2.tar.gz 
tar xvf V4.6.2.tar 
cd cdhit-4.6.2/;ls
make
#再给cdhit添加环境变量
cd-hit -i GCF_000001635.26_GRCm38.p6_protein.faa.gz  -o mouse_simp.fasta -c 0.9 
#去冗余剪切本,保留最长的剪切本
  • 会得到两个文件(这里是玉米氨基酸文件得到的,用来举例)


    image.png
makeblastdb -in zea_simp.fasta -dbtype prot -parse_seqids -out zea_simp1.protein.db
#得到构建的本地库
blastp -query ATYTH.fasta -db zea_simp1.protein.db -out yth_simp.blast -evalue 1e-10 -num_threads 4 -outfmt 6 -num_alignments 5
##比对
cat yth_simp.blast 
cat yth_simp.blast|awk '$3>=30 {print $0}' >>yth30.txt 
#取相似性大于30
cat yth30.txt #根据要求设置阈值
  • 保存得到的ID


    image.png

3.利用TBtools工具,用ID提取出氨基酸序列,导出为fasta格式文件

image.png
image.png

二、MEGA多序列比对

  • 导入fasta文件
  • Edit--select all
  • Alignment-align by clustalW


    image.png
  • Data- Export alignment- fasta format/mega format

三、Jalview美化多序列比对结果

四、进化树分析

五、进化树美化(只用EvolView就可以)

1.FigTree(最基础的工具,不推荐,美化程度较小)

http://tree.bio.ed.ac.uk/software/figtree/

image.png image.png
image.png

2.EvolView(推荐程度五颗星)

EvolView : login https://www.evolgenius.info/evolview/#login

image.png
  • 根据帮助文档构建一个数据集


    image.png
image.png
  • 帮助文档中的数据集例子


    image.png
  • 在EXCEL中构建


    image.png
  • 选择模式


    image.png

相关文章

  • Phylogeny系统进化树的一键化构建——Perl_pipel

    背景 一行命令构建系统进化树。其实这个想法去年的时就开始构思了。当时在给师兄师姐帮忙构建几个基因家族的系统进化树,...

  • 生信小白如何做出惊艳BOSS老板的进化树

    初次接触生物的朋友,通过前期的构建进化树学习已经学会构建系统进化树了,但是这样的进化树只能作为一个简单的草图进行展...

  • 系统进化树的构建

    一、多物种某基因家族的氨基酸序列fasta文件的准备(此例为yth基因家族) 1.已鉴定物种的某基因家族文件的获取...

  • snp数据构建NJtree(phylip软件)

    参考链接 SNP数据构建系统进化树 - 简书[https://www.jianshu.com/p/57599b6a...

  • 一文读懂进化树(图文详解)

    一、什么是进化树 系统发育进化树 (Phylogenetic tree):** 一般也叫系统进化树,进化树。它可以...

  • 构建发育树 Bootstrap值

    即自展值,可用来检验所计算的进化树分支可信度。Bootstrap几乎是构建系统进化树一个必须的选项。一般Boots...

  • 系统进化树简介及构建

    系统进化树学习笔记。 系统进化树简介 系统进化树(Phylogenetic tree):用一种类似树状分支图形来概...

  • 进化树-itol上色美化

    进化树或者系统发育树在微生物及群体结构分析中是很常见的分析条目。进化树构建有很多方法,结果也大体相似,但是最终呈现...

  • 新型冠状病毒序列构建进化树

    编译:王采荷 关于进化树(系统发育进化树,Phylogenetic tree),一般也叫作系统进化树它的用途我这里...

  • newick格式的tree文件

    基于遗传距离构建进化树的过程中,会先得到不用样本之间的遗传遗传距离,然后构建进化树,但在tree文件中是以表示分枝...

网友评论

    本文标题:系统进化树的构建

    本文链接:https://www.haomeiwen.com/subject/ufonhktx.html