美文网首页
病原微生物笔记-Taxonomy 分类流程解决⽅方案

病原微生物笔记-Taxonomy 分类流程解决⽅方案

作者: XuningFan | 来源:发表于2021-01-19 00:14 被阅读0次

    Taxonomy 分类流程解决⽅方案

    1.使⽤用Kraken2对其中的微⽣生物进⾏行行物种注释.Kraken2是⼀一个基于k-mer算法的⾼高精度宏基因组序列列分 类软件,能够快速的将测序reads进⾏行行物种分类(https://genomebiology.biomedcentral.com/articles /10.1186/s13059-019-1891-0)

    2.使⽤用Bracken对物种注释结果计算相对丰度。Bracken是⼀一款基于kraken的⾼高度精确的统计软件,可 以从宏基因组学样本计算DNA序列列中物种的丰度。(https://peerj.com/articles/cs-104/)

    3.对物种注释结果使⽤用 KRONA 进⾏行行可视化展示,Krona采⽤用多图层饼,可以展示不不同的taxa rank的占 ⽐比。

    image.png
    Kraken2
    Kraken2安装
    kraken2 github 地址 : https://github.com/DerrickWood/kraken2
    Kraken2 wiki :http://ccb.jhu.edu/software/kraken/
    Kraken2 教程:https://github.com/DerrickWood/kraken2/wiki/Manual kraken2 安装⽤用conda ⼀一般都可安装成功
    conda install -c bioconda kraken2
    Kraken2 原理理:
    kraken2 的基本原理理有两个
    1.是建⽴立以kmer为主的 taxonomy tree 数据库:

    ⼆二是将Query(测序序列列)切成kmer(默认35bp)采⽤用LCA(最⼩小共同祖先)的⽅方法 并将其⽐比对到Taxonomy tree数据库上,计算⽐比对上的次数,然后计算从根到叶⼦子的权重 2.是采⽤用hash 的⽅方法将数据库和索引映射到内存,如下图:
    image.png

    测试数据介绍:

    BJ184 为 SARAS模拟数据 Kraken2 数据库下载

    kraken2-build --standard --db kraken2_Database 如果说你只是关注⼀一下⼦子数据库,⽐比如说只关注病毒的,也可以通过⼀一下命令进⾏行行下载 taxonomy数据

    库和viral的数据库。 kraken2-build --download-taxonomy --db $DBNAME

    <pre> kraken2-build --download-library viral --db $DBNAME </pre>

    <pre>下载完成后会出现病毒的基因组序列列。 </pre>


    image.png

    注意
    很多时候下载数据库的时候会遇到rsync 错误,如下:


    image.png

    主要是当前⽹网络与NCBI连接不不稳定,这种时候,别⽆无他法,就只能多试⼏几次了了......
    Kraken2 索引构建 下载完数据库之后呢,就需要建⽴立Kraken的index了了,--db参数需要跟你下载的数据库⽬目录。


    image.png

    执⾏行行这⼀一步操作,你会发现你的database多了了3个索引⽂文件


    Kraken2索引下载
    此外如果你不不想⾃自⼰己下载数据库,构建索引,kraken2 还提供了了现成的,直接下载即可。 https://benlangmead.github.io/aws-indexes/k2
    Kraken2 鉴定

    image.png
    Bracken
    bracken安装
    bracken github地址:https://github.com/jenniferlu717/Bracken
    bracken 安装⽤用conda即可安装成功 conda install -c bioconda bracken bracken 索引构建:
    bracken-build -d Kraken2_Database 注意
    -x 为 kraken2 安装路路径 结果展示:

    bracken 丰度计算:
    bracken -d Kraken2_Database -i BJ184.kraken.report -o BJ184.bracken.count -r 35 -t 10 ⽣生成⽂文件如下:
    BJ184.kraken_bracken_species.report image.png

    BJ184.bracken.count

    image.png

    Kraken2krona:

    https://github.com/lskatz/lskScripts/blob/master/scripts/kraken2-translate.pl

    image.png

    Krona
    krona 安装
    krona github地址:https://github.com/marbl/Krona
    Krona 安装: conda install -c bioconda krona 即可 https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1891-0 krona 可视化
    ktImportText BJ184.kraken2krona -o BJ184.krona.html

    image.png

    相关文章

      网友评论

          本文标题:病原微生物笔记-Taxonomy 分类流程解决⽅方案

          本文链接:https://www.haomeiwen.com/subject/maifzktx.html