美文网首页基因组学
PhyloPhlAn3系统进化分析

PhyloPhlAn3系统进化分析

作者: 胡童远 | 来源:发表于2021-08-31 15:29 被阅读0次

PhyloPhlAn3.0:https://huttenhower.sph.harvard.edu/phylophlan
GitHub:https://github.com/biobakery/phylophlan

一、安装:

conda install -c bioconda phylophlan=3.0

失败

conda create -n python3.7 -c bioconda python=3.7  #创建新的环境
conda activate python3.7  # 进入环境
conda install phylophlan=3.0  # 安装
phylophlan --version  # 检查
# PhyloPhlAn version 3.0.51 (11 May 2020)
# PhyloPhlAn version 3.0.60 (27 November 2020)

成功

另外安装metaphlan3时会安装phyliphlan3作为依赖。

conda create -n metaphlan python=3.7
conda activate metaphlan
conda install tbb=2020.2
conda install bowtie2
conda install -c bioconda metaphlan
phylophlan --version
# PhyloPhlAn version 3.0.60 (27 November 2020)

成功

二、获取数据库

phylophlan有自己的数据库,也支持自建数据库。

地址:http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/phylophlan_databases.txt

#database_name  database_url    database_md5
amphora2    
http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/amphora2.tar 
http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/amphora2.md5
#amphora2   https://zenodo.org/record/4005745/files/amphora2.tar?download=1 https://zenodo.org/record/4005745/files/amphora2.md5?download=1
phylophlan  
http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/phylophlan.tar   
http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/phylophlan.md5
#phylophlan https://zenodo.org/record/4005620/files/phylophlan.tar?download=1   https://zenodo.org/record/4005620/files/phylophlan.md5?download=1

linux bad connection, win下载tar压缩文件:

# md5编号
587698f1b8593daba2719d587ba43463  amphora2.tar
9b3ce73a1d4808620161c27d7a739b48  phylophlan.tar
# 验证md5,不报错就是没错
diff <(md5sum amphora2.tar) amphora2.md5
diff <(md5sum phylophlan.tar) phylophlan.md5

悄悄改一个编号会被发现,测试diff的使用,

解压

tar -xf amphora2.tar # 解压文件夹
bzcat amphora2/*.bz2 > amphora2/amphora2.faa # 解压合并文件

amphora一共136个marker gene,合并到一个faa蛋白序列文件

tar -xf phylophlan.tar # 解压文件夹
bunzip2 -k phylophlan/phylophlan.faa.bz2

phylophlan只有一个蛋白序列文件,34万条蛋白序列,

最后清除所有压缩文件。

三、建数据库索引

diamond索引

diamond makedb --in amphora2/amphora2.faa --db amphora2/amphora2
diamond makedb --in phylophlan/phylophlan.faa --db phylophlan/phylophlan

四、Tutorials

案例教程:https://github.com/biobakery/biobakery/wiki/PhyloPhlAn3

  • 案例一:
    1 获取S. aureus一个基因组
    2 联网获取S. aureus基因组的UniRef90 core proteins
    phylophlan_setup_database -g s__Staphylococcus_aureus
    3 进化树
    4 获取S. aureus更多参考基因组
    5 进化树,GraPhlAn可视化

  • 案例二:不依赖UniRef90,重建进化树phylophlan -d phylophlan

  • 案例三:meta组装SGB数据处理
    1 获取Ethiopian宏基因组genome bins
    2 SGB.Jan19作为参考给bins做注释 phylophlan_metagenomic -d SGB.Jan19
    3 热图展示Bin在样本中的有无,SGB的分类和数量

第一张热图显示在埃塞俄比亚人群中发现的前21个 SGB 的存在/缺失情况;第二张热图显示每个宏基因组样本中有多少 uSGBs (unknown)、 kSGBs (known) 和未分配的分箱。

  • 案例四:
    1 获取E. coli bins
    2 获取E. coli bins的core set of UniRef90 proteins
    phylophlan_setup_database -g s__Escherichia_coli
    3 添加E. coli参考基因组
    phylophlan_get_reference -g s__Escherichia_coli
    4 configure,建树

  • 案例五:uSGB和close phyla reference建树
    1 获取uSGB
    2 获取Epsilonproteobacteria class参考-g c__Epsilonproteobacteria
    3 获取close phyla参考-g p__Spirochaetes
    4 configure,建树

参考:
PhyloPhlAn 3.0 微生物组系统发育分析

相关文章

  • PhyloPhlAn3系统进化分析

    PhyloPhlAn3.0:https://huttenhower.sph.harvard.edu/phyloph...

  • ape包01:介绍

    ape全称Analyses of Phylogenetics and Evolution,主要用于系统进化树分析,...

  • 群体进化-GWAS分析

    群体进化-gwas分析 群体进化基础分析 PCA 分析原理PCA(Principal Component ...

  • 进化树-itol上色美化

    进化树或者系统发育树在微生物及群体结构分析中是很常见的分析条目。进化树构建有很多方法,结果也大体相似,但是最终呈现...

  • 机器学习之回归分析

    一、回归分析的应用 1、股票分析 2、无人驾驶 3、推荐系统 二、实例应用 评估pokemon(宝可梦)进化后的C...

  • MOOC大学 脑洞大开背后的创新方法 第三章 技术系统进化趋势

    3.1技术系统进化趋势 3.2 S曲线 3.3 技术系统进化法则(1-4) 3.4 技术系统进化法则(5-8) ...

  • 纺织行业MES系统的需求分析

    纺织行业MES系统的需求分析导读:近年来我国纺织行业的高速发展带动了设备的进化,从而为MES系统应用带来机会。目前...

  • 系统进化树简介及构建

    系统进化树学习笔记。 系统进化树简介 系统进化树(Phylogenetic tree):用一种类似树状分支图形来概...

  • 一文读懂进化树(图文详解)

    一、什么是进化树 系统发育进化树 (Phylogenetic tree):** 一般也叫系统进化树,进化树。它可以...

  • 科学问题

    微生物多样性原因(单细胞测序,单菌的进化)生长繁殖快,突变速率高,分子进化水平揭示,多样化的微生物世界系统发育分析...

网友评论

    本文标题:PhyloPhlAn3系统进化分析

    本文链接:https://www.haomeiwen.com/subject/ckzrfktx.html