$ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG002_1.fastq.gz | samtools view -@ 12 -bS | samtools sort -@ 12 -o HG002_1.minimap2.align.bam
#或者可以用以下命令一步完成sam到bam,排序和索引
$ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG002_1.fastq.gz | samtools sort -@ 12 -o HG002_1.minimap2.align.bam --write-index -
#最终版本, samtools=1.18
$ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG002_1.fastq.gz | samtools sort -@ 12 -o HG002_1.minimap2.align.bam --write-index -
$ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG003.fastq.gz | samtools sort -@ 12 -o HG003.minimap2.align.bam --write-index -
$ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG004.fastq.gz | samtools sort -@ 12 -o HG004.minimap2.align.bam --write-index -
#最终版本, samtools=1.9
$ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG002_1.fastq.gz | samtools view -@ 12 -bS | samtools sort -@ 12 -o HG002_1.minimap2.align.bam
$ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG003.fastq.gz | samtools view -@ 12 -bS | samtools sort -@ 12 -o HG003.minimap2.align.bam
$ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG004.fastq.gz | samtools view -@ 12 -bS | samtools sort -@ 12 -o HG004.minimap2.align.bam
#因为samtools=1.9没有sort没有--write-index选项
对于minimap2的参数:
-a Generate CIGAR and output alignments in the SAM format. Minimap2 outputs in PAF by default.
--MD
Output the MD tag (see the SAM spec).(后面sniffles软件需要MD tag)
-t Number of threads CPU线程数.
-x STR preset (always applied before other options; see minimap2.1 for details) .
使用NGLMR比对
ngmlr -t 10 -r /public/home/fengting/database/reference/rice/IRGSP-1.0_genome.fasta -q /public/home/fengting/data/hhz/H7L$i.arrow.polish.fasta -o /public/home/fengting/data/rihhz/H7L$i.sam
picard SamFormatConverter -I $id.sam -O bam/$id.bam
~/tools/samtools/samtools-0.1.19/samtools sort bam/$id.bam bam/$id.s
#单样本分别检测变异
sniffles -t 12 --input HG002_1.minimap2.align.bam --vcf HG002_1.vcf.gz --snf HG002_1.snf --tandem-repeats Human_ref/human_GRCh38_no_alt_analysis_set.trf.bed
sniffles -t 12 --input HG003.minimap2.align.bam --vcf HG003.vcf.gz --snf HG003.snf --tandem-repeats Human_ref/human_GRCh38_no_alt_analysis_set.trf.bed
sniffles -t 12 --input HG004.minimap2.align.bam --vcf HG004.vcf.gz --snf HG004.snf --tandem-repeats Human_ref/human_GRCh38_no_alt_analysis_set.trf.bed
#joint calling
$ sniffles --input HG002_1.snf HG003.snf HG004.snf --vcf multisample.vcf.gz
Sniffles是一个用于检测结构变异(SVs)的工具,它主要用于长读长序列数据,如PacBio或Nanopore数据。以下是一些常用的Sniffles参数:
- -m/--min_support:指定支持阈值,即在结构变异(SV)检测中至少需要的读数支持数量。默认值为3。
- -s/--minmapqual:指定最小比对质量,即比对到基因组上的最小质量阈值。默认值为30。
“-q”用于指定最小的Phred质量值阈值。Phred质量值是用于表示测序质量的一种常用的质量评分方式,通常在0-40的范围内,数值越高表示质量越好。在Sniffles中,参数“-q”可以用来过滤掉质量低于指定阈值的比对信息,以提高结构变异(SV)检测的准确性。- -d/--minvar:指定结构变异(SV)的最小大小。默认值为50。
- -t/--threads:指定使用的线程数,可以加快处理速度。默认值为1。
- -I/--ignoreIllumina:忽略Illumina数据,只考虑长读长序列数据。
- -C/--cluster:指定聚类参数,用于将多个结构变异(SV)合并为单个事件。
群call
ls *sample.vcf > vcf_files_raw_calls.txt
SURVIVOR merge vcf_files_raw_calls.txt 1000 1 1 -1 -1 -1merged.vcf
sniffles -m ../sbam/az.s.bam -t 11 -v vcf/az.vcf --Ivcf merged.vcf
然后运行SURVIVOR:
SURVIVOR merge vcf_files_gt_calls.txt 1000 -1 1 -1 -1 -1 merged_gt_SURVIVOR_1kbpdist_typesave.vcf
(The -1 for the minimum SV caller is necessary to obtain all calls even if they might be 0/0 in all samples.)
网友评论