美文网首页注释和富集生信专题基因组学
简单、快速,KEGG批量注释--kobas如何实现本地化

简单、快速,KEGG批量注释--kobas如何实现本地化

作者: 手握镰刀和锤子的打工人 | 来源:发表于2021-03-16 17:48 被阅读0次

注意 :kobas支持python2 版本,本文安装使用的是Centos 7.4系统

pip安装:

(1)出现的问题网址:https://www.cnblogs.com/saolv/p/6963314.html
(2)安装:

    sudo yum -y install epel-release
    sudo yum -y install python-pip 

PySQLite 的安装:

(1) 出现的问题error: command ‘gcc’ failed with exit status 1;
解决方案如下 (参考网址:https://blog.csdn.net/u010445516/article/details/76850704);

yum install libsqlite3x.x86_64 #使用命令yum search sqlite3进行搜索,然后选择libsqlite3x.x86_64并安装
yum install libsqlite3x-devel  #使用命令yum search sqlite3进行搜索,然后选择libsqlite3x-devel并安装
sudo pip install PySQLite

NCBIblast 的安装:

wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.7.1+-x64-linux.tar.gz
tar -zxvf ncbi-blast-2.7.1+-x64-linux.tar.gz
echo 'export PATH=/root/biosoft/ncbi-blast-2.7.1+/bin:$PATH' >> ~/.bashrc 
source ~/.bashrc

KOBAS 安装:

出现的问题:
(1)如果rpy2报错,直接重装rpy2,命令:pip install rpy2==2.7.8

  1. download kobas (http://kobas.cbi.pku.edu.cn/help.do)

kobas-3.0.3.tar.gz、organism.db.gz、ko.db.gz、ko.pep.fasta.gz

  1. R ,qvalue的安装
  1. python 相关模块安装
sudo pip install rpy2==2.7.8 #支持python2,
sudo pip install BioPython  
sudo pip install PySQLite
  1. blast (ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/)
  • ncbi-blast-2.2.31+-x64-linux.tar.gz
tar -zxvf ncbi-blast-2.2.31+-x64-linux.tar.gz
echo 'export PATH=/root/biosoft/ncbi-blast-2.7.1+/bin:$PATH' >> ~/.bashrc
  1. install kobas
tar -zxvf kobas-3.0.3.tar.gz 
cd kobas-3.0/
  1. 将压缩包 organism.db.gz 和 ko.db.gz 拷贝到 sqlite3文件夹下
gzip -d organism.db.gz
gzip -d ko.db.gz
  1. 将压缩包ko.pep.fasta.gz拷贝到seq_pep文件夹下
gzip -d ko.pep.fasta.gz
  1. 将KOBAS软件的执行脚本添加到 ~/.bashrc
echo 'export PATH=$PATH:/root/biosoft/kegg/kobas-3.0/scripts' >>~/.bashrc
  1. 安装KOBAS相应的模块到python中,注意:不是kobas-3.0/src/kobas目录
echo 'export PYTHONPATH=$PYTHONPATH:/root/biosoft/kegg/kobas-3.0/src' >> ~/.bashrc 
  1. 修改kobasrc中的kobas_home和blast_home
kobas_home = /root/biosoft/kegg/kobas-3.0
blast_home = /root/biosoft/ncbi-blast-2.7.1+/bin
cp kobasrc ~/.kobasrc  #将kobasrc文件拷贝到~/.kobasrc目录下

6 KOBAS 的使用

若出现如下类似的问题:

unable to load shared object /xxxx/xxx/R-install/lib64/R/library/stats/libs/stats.so
libRlapack.so: cannot open shared object file: No such file or directory

则解决方案为:

export R_HOME=/usr/local/lib64/R/   #设置R的工作目录
export LD_LIBRARY_PATH=${R_HOME}/lib:${LD_LIBRARY_PATH} #设置动态库的查找路径

使用命令 (加粗部分为自己要填写的内容):

annotate.py -i all_genomic_gene.fasta -s ko -t fasta:nuc -o all_genomic_geneGene.ann -n 4
annotate.py -i diff_gene.fasta -s ko -t fasta:nuc -o diff_gene.ann -n 4
identify.py -f diff_gene.ann -b all_genomic_gene.ann -d K -o kegg.result.xls

完成注释
2021.3.16
本文转载自“学术传真”微信公众号

相关文章

网友评论

    本文标题:简单、快速,KEGG批量注释--kobas如何实现本地化

    本文链接:https://www.haomeiwen.com/subject/ayidcltx.html