Taxonomy 分类流程解决⽅方案
1.使⽤用Kraken2对其中的微⽣生物进⾏行行物种注释.Kraken2是⼀一个基于k-mer算法的⾼高精度宏基因组序列列分 类软件,能够快速的将测序reads进⾏行行物种分类(https://genomebiology.biomedcentral.com/articles /10.1186/s13059-019-1891-0)
2.使⽤用Bracken对物种注释结果计算相对丰度。Bracken是⼀一款基于kraken的⾼高度精确的统计软件,可 以从宏基因组学样本计算DNA序列列中物种的丰度。(https://peerj.com/articles/cs-104/)
3.对物种注释结果使⽤用 KRONA 进⾏行行可视化展示,Krona采⽤用多图层饼,可以展示不不同的taxa rank的占 ⽐比。

Kraken2
Kraken2安装
kraken2 github 地址 : https://github.com/DerrickWood/kraken2
Kraken2 wiki :http://ccb.jhu.edu/software/kraken/
Kraken2 教程:https://github.com/DerrickWood/kraken2/wiki/Manual kraken2 安装⽤用conda ⼀一般都可安装成功
conda install -c bioconda kraken2
Kraken2 原理理:
kraken2 的基本原理理有两个
1.是建⽴立以kmer为主的 taxonomy tree 数据库:

⼆二是将Query(测序序列列)切成kmer(默认35bp)采⽤用LCA(最⼩小共同祖先)的⽅方法 并将其⽐比对到Taxonomy tree数据库上,计算⽐比对上的次数,然后计算从根到叶⼦子的权重 2.是采⽤用hash 的⽅方法将数据库和索引映射到内存,如下图:

测试数据介绍:
BJ184 为 SARAS模拟数据 Kraken2 数据库下载
kraken2-build --standard --db kraken2_Database 如果说你只是关注⼀一下⼦子数据库,⽐比如说只关注病毒的,也可以通过⼀一下命令进⾏行行下载 taxonomy数据
库和viral的数据库。 kraken2-build --download-taxonomy --db $DBNAME
<pre> kraken2-build --download-library viral --db $DBNAME </pre>
<pre>下载完成后会出现病毒的基因组序列列。 </pre>

注意
很多时候下载数据库的时候会遇到rsync 错误,如下:

主要是当前⽹网络与NCBI连接不不稳定,这种时候,别⽆无他法,就只能多试⼏几次了了......
Kraken2 索引构建 下载完数据库之后呢,就需要建⽴立Kraken的index了了,--db参数需要跟你下载的数据库⽬目录。

执⾏行行这⼀一步操作,你会发现你的database多了了3个索引⽂文件

Kraken2索引下载
此外如果你不不想⾃自⼰己下载数据库,构建索引,kraken2 还提供了了现成的,直接下载即可。 https://benlangmead.github.io/aws-indexes/k2
Kraken2 鉴定

Bracken
bracken安装
bracken github地址:https://github.com/jenniferlu717/Bracken
bracken 安装⽤用conda即可安装成功 conda install -c bioconda bracken bracken 索引构建:
bracken-build -d Kraken2_Database 注意
-x 为 kraken2 安装路路径 结果展示:

bracken 丰度计算:
bracken -d Kraken2_Database -i BJ184.kraken.report -o BJ184.bracken.count -r 35 -t 10 ⽣生成⽂文件如下:
BJ184.kraken_bracken_species.report

BJ184.bracken.count

Kraken2krona:
https://github.com/lskatz/lskScripts/blob/master/scripts/kraken2-translate.pl

Krona
krona 安装
krona github地址:https://github.com/marbl/Krona
Krona 安装: conda install -c bioconda krona 即可 https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1891-0 krona 可视化
ktImportText BJ184.kraken2krona -o BJ184.krona.html

网友评论