参考hifiasm网页代码: https://github.com/chhylp123/hifiasm
ssh 进入一个登录节点
从subreads 里提取hifi数据 利用ccs软件
ccs m64033_210412_083226.subreads.bam m64033_210412_083226.ccs.bam
ccs m64083_210501_064735.subreads.bam m64083_210501_064735.ccs.bam
数据压缩、合并
gzip m64033_210412_083226.ccs.fastq m64083_210501_064735.ccs.fastq
cat m64033_210412_083226.ccs.fastq.gz m64083_210501_064735.ccs.fastq.gz > GX.HiFi.fq.gz
运行hifiasm
hifiasm -o test -t32 -f0 GX.HiFi.fq.gz 2 > test.log
-o:定义输出文件的文件名前缀, -t:线程数
get primary contigs in FASTA
提取数据
awk '/^S/{print ">"$2;print $3}' GX.HiFi.fq.gz > test.p_ctg.fa
下载fasta文件 test.p_ctg.fa 与基因组文件比对
homozygous genomes
Assemble inbred/homozygous genomes (-l0 disables duplication purging)
hifiasm -o CHM13.asm -t32 -l0 CHM13-HiFi.fa.gz 2> CHM13.asm.log
一般用:f0参数
基因型是杂合的时候参数:l0
minimap比对
参考:[GitHub - lh3/minimap2: A versatile pairwise aligner for genomic and sload/v2.24/minimap2-2.24_x64-linux.tar.bz2 | tar -jxvf -
./minimap2-2.24_x64-linux/minimap2
方法1
(1):index
minimap2 -d ref.mmi R64.fna
-d FILE: dump index to FILE []
生成索引文件ref.mmi
(2)alignment
nohup minimap2 -a ref.mmi ~/WGS/SY14/pacbio/fastq1/SRR6823435.fastq.gz > alignment1.sam
在minimap2命令行中用索引文件替换引用序列文件
方法2
nohup minimap2 -ax map-pb R64.fna ~/WGS/SY14/pacbio/fastq1/SRR6823435.fastq.gz > alignment2.sam
参数设置:
-a: output in the SAM format (PAF by default)
-x STR: preset (always applied before other options; see minimap2.1 for details) []
- map-pb/map-ont - PacBio CLR/Nanopore vs reference mapping
- map-hifi - PacBio HiFi reads vs reference mapping
网友评论