美文网首页Transcriptomics生物信息学
Unicycler二代、三代混合组装、矫错、抛光

Unicycler二代、三代混合组装、矫错、抛光

作者: 胡童远 | 来源:发表于2020-01-13 19:51 被阅读0次

导读

Unicycler傻瓜组装法。

文章:Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads
杂志:PLoS Comput Biol.
时间:2017

一、下载、安装Unicycler及依赖

地址:https://github.com/rrwick/Unicycler

git clone https://github.com/rrwick/Unicycler.git
cd Unicycler
make

运行试试:

# unicycler混合组装
time unicycler-runner.py -t 52 \
-1 clean_data/1B_R1_paired.fq -2 clean_data/1B_R2_paired.fq \
-l clean_data/1B.pacbio.fa -o unicyc

报错,显示依赖:

很多依赖

下载、安装:spades

地址:http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Linux.tar.gz

wget -c http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Linux.tar.gz

下载安装:racon

地址:https://github.com/isovic/racon

git clone --recursive https://github.com/isovic/racon.git racon
cd racon
mkdir build && cd build && cmake ../  # cmakecache.txt的位置
make

下载安装:pilon

地址:https://github.com/broadinstitute/pilon/releases/download/v1.23/pilon-1.23.jar

wget -c https://github.com/broadinstitute/pilon/releases/download/v1.23/pilon-1.23.jar
java -jar /home/cheng/huty/softwares/pilon-1.23.jar --help
# java程序,免安装

全局:unicycler, spades, racon, pilon

# 在程序所在目录内进行以下操作
ln -s $(readlink -f ./unicycler-runner.py) ~/bin/
ln -s $(readlink -f pilon-1.23.jar) ~/bin/
ln -s $(readlink -f ./spades.py) ~/bin/
ln -s $(readlink -f ./racon) ~/bin/

conda安装

conda create -n assembly
conda activate assembly
conda install unicycler
# samtools 报错
conda update samtools

二、Unicycler混合组装

再次运行试试:

# unicycler混合组装
time unicycler-runner.py -t 52 \
-1 clean_data/1B_R1_paired.fq -2 clean_data/1B_R2_paired.fq \
-l clean_data/1B.pacbio.fa -o unicyc

依赖情况:

很OK

组装过程:

  • 1 二代矫错:spades read error correction
  • 2 二代组装:spades assemblies
  • 3 混合组装:assembling contigs and long reads with miniasm
  • 4 比对:aligning reads
  • 5 搭桥:building long read bridges
  • 6 抛光:polishing assembly with pilon

组装结果

查看结果文件,得到组装结果:assembly.fasta

-rw-rw-r--  1 cheng WST 2933634 1月   7 18:06 001_best_spades_graph.gfa
-rw-rw-r--  1 cheng WST 2909841 1月   7 18:06 002_overlaps_removed.gfa
-rw-rw-r--  1 cheng WST 2920506 1月   7 18:17 003_bridges_applied.gfa
-rw-rw-r--  1 cheng WST 2906329 1月   7 18:17 004_final_clean.gfa
-rw-rw-r--  1 cheng WST 2906330 1月   7 19:32 005_polished.gfa
-rw-rw-r--  1 cheng WST 2945006 1月   7 19:32 assembly.fasta
-rw-rw-r--  1 cheng WST 2906330 1月   7 19:32 assembly.gfa
-rw-rw-r--  1 cheng WST   17815 1月   7 19:32 unicycler.log

三、组装二代

kneaddata质控

kneaddata \
-i ./rawdata/FC2282_FDSW210258126-1r_1.fq \
-i ./rawdata/FC2282_FDSW210258126-1r_2.fq \
-o ./cleandata/ \
--trimmomatic /miniconda3/envs/kneaddata/share/trimmomatic/ \
-t 4 \
--trimmomatic-options "SLIDINGWINDOW:4:20 MINLEN:50" \
--remove-intermediate-output

Error: the paired read input files have an unequal number of reads
第一组数据是最终结果,但是unpair (报错),所以选择第二组数据。

组装

unicycler -t 16 \
-1 ./cleandata/FC2282_FDSW210258126-1r_1_kneaddata.trimmed.1.fastq \
-2 ./cleandata/FC2282_FDSW210258126-1r_1_kneaddata.trimmed.2.fastq \
-o ./assembly_unicyc/

结果

相关文章

网友评论

    本文标题:Unicycler二代、三代混合组装、矫错、抛光

    本文链接:https://www.haomeiwen.com/subject/adwaactx.html