美文网首页
宏基因组--简单流程(代码)

宏基因组--简单流程(代码)

作者: 晓佥 | 来源:发表于2019-06-06 10:35 被阅读0次

软件1、cutadapt

input=test.fq.gz
mkdir -p cutadapt
cutadapt_input=$input

cutadapt_out=cutadapt/trimed.fastq.gz
interleaved=--interleaved
cutadapt $interleaved -a AGATCGGAAGAGC -A AGATCGGAAGAGC -q 30 -m 20 --trim-n -O 10 -o $cutadapt_out $cutadapt_input

软件2、megahit

input_fa=$cutadapt_out
assembly_out=assembly_out
megahit --12 $input_fa --k-max 149 --max-tip-len 200 --min-contig-len 300 -o $assembly_out

软件3、MetaGeneMark

mkdir -p predict_gene
input_dir=assembly_out
predict_gene_out=predict_gene
model_file=../MetaGeneMark_linux_64/mgm/MetaGeneMark_v1.mod
cp ../MetaGeneMark_linux_64/gm_key ~/.gm_key
gmhmmp -d -f G -m $model_file -o $predict_gene_out/out.gff -A $predict_gene_out/final.prot.fa -D $predict_gene_out/final.nucl.fa $input_dir/final.contigs.fa

软件4、cd-hit

mkdir -p unigene_set
python filter_predict_nucl.py $predict_gene_out/final.nucl.fa $predict_gene_out/filter_final.nucl.fa #自写脚本
cd-hit -i $predict_gene_out/filter_final.nucl.fa -o unigene_set/unigene.fa -c 0.95 -aS 0.9 -d 0 -M 10000 -T 0

软件5、diamond

mkdir -p function_anno
#数据库文件需自行下载
database_eggNOG=.../metagenomics/function/database/e5.proteomes
diamond_eggNOG=function_anno/unigene.e5

database_CARD=.../metagenomics/function/database/CARD/CARD.protein
diamond_CARD=function_anno/unigene.CARD

database_CAZy=.../metagenomics/function/database/CAZy/CAZyDB.07202017
diamond_CAZy=function_anno/unigene.CAZyDB

database_PHI=.../metagenomics/function/database/PHI/phi-base_current
diamond_PHI=function_anno/unigene.phi

diamond blastx -d $database_eggNOG -q unigene_set/unigene.fa -o $diamond_eggNOG --evalue 0.00001
diamond blastx -d $database_CARD -q unigene_set/unigene.fa -o $diamond_CARD --evalue 0.00001
diamond blastx -d $database_CAZy -q unigene_set/unigene.fa -o $diamond_CAZy --evalue 0.00001
diamond blastx -d $database_PHI -q unigene_set/unigene.fa -o $diamond_PHI --evalue 0.00001

相关文章

  • 宏基因组--简单流程(代码)

    软件1、cutadapt input=test.fq.gzmkdir -p cutadaptcutadapt_in...

  • 宏蛋白质组研究概述

    前言 宏组学(Meta-Omics)是涵盖宏基因组学、宏转录组学和宏蛋白质组学的一门学科。其中宏基因组研究可以获知...

  • 基因组组装----SOAPdenovo2

    1.基因组组装的流程 基因组组装的大概流程如下: (1) 测序得到raw reads序列。 (2) Reads质量...

  • 工作记录_2018-01-16

    带法国项目:熟悉工作流程。 了解客户需求。spl 测试等等。。 了解宏控的使用,了解宏控和代码编译的方式,mode...

  • 3. SNP Calling

    以GATK流程为例,简单来说,SNP Calling主要包括以下几步: 1. 给参考基因组建立索引:samtool...

  • iOS-宏

    作用:简单说:使代码简洁,增加可读性,减少工作量。 分类:对象宏、函数宏。 比如:对象宏 这种 #define X...

  • 基于git的代码版本管理规范及流程-简版

    基于git的简单实用的版本管理规范及流程,包括:代码库的分布、人员角色的划分、代码提交合并流程、代码冲突处理、分支...

  • metawrap

    Microbiome:宏基因组分箱流程MetaWRAP简介 MetaWRAP分箱流程实战和结果解读

  • Mtk功能机,项目编译与宏控制

    流程简介 声明一个开关 检测到开关,定义宏 宏控制着代码的引入编译 声明一个开关 文件:EC618AE_ENG_G...

  • oc中宏的使用

    概述 宏,可以简单的理解为一个被赋予名字的代码段。当这个名字出现在代码中被使用的时候,就会被替换成相应的代码段。宏...

网友评论

      本文标题:宏基因组--简单流程(代码)

      本文链接:https://www.haomeiwen.com/subject/mfjyxctx.html