GetOrganelle
https://github.com/Kinggerm/GetOrganelle
GetOrganelle是中国科学院昆明植物研究所金建军和郁文彬两位老师共同开发的质体组装软件,论文发表在Genome Biology。
GetOrganelle的核心流程包括:
1)通过“种子”序列获得部分目标相关reads;
2)延伸reads获得所有目标相关reads;
3)对reads进行从头组装得到组装图形;
4)过滤组装图形;
5)识别细胞器组分并自动导出所有可能的细胞器基因组结构。
安装
1.使用conda安装,先创建一个环境。
conda create -n getorganelle
2.激活环境,并安装软件。
conda activate getorganelle
3.安装完成后,需要下载参考序列库。
get_organelle_config.py --add embplant_pt,embplant_mt
可以通过查看帮助文档来查询软件具体参数的用法。
image
-1 双端测序的R1
-2 双端测序的R2
-o 结果文件
-F 数据库
-s 参考序列
-t 线程数
-R 最大的一个扩充循环的数,一般默认15
-k kmer的一个参数
4.基本用法。
植物的2G左右的数据,组装叶绿体基因组用命令
get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o plastome_output -R 15 -k 21,45,65,85,105 -F embplant_pt
更快的方法
get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o plastome_output --fast -k 21,65,105 -w 0.68 -F embplant_pt
组装植物线粒体基因组
get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o mitochondria_output -R 50 -k 21,45,65,85,105 -P 1000000 -F embplant_mt
组装植物核核糖体DNA片段
get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o nr_output -R 10 -k 35,85,115 -F embplant_nr
组装真菌线粒体
get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -R 10 -k 21,45,65,85,105 -F fungus_mt -o fungus_mt_out
组装真菌的核糖体
get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -R 10 -k 21,45,65,85,105 -F fungus_nr -o fungus_nr_out
组装动物线粒体
get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -R 10 -k 21,45,65,85,105 -F animal_mt -o animal_mt_out
得到的文件是有complete就代表拼接是成环了。
end
网友评论