美文网首页
三代测序数据结构变异检测

三代测序数据结构变异检测

作者: 花生学生信 | 来源:发表于2024-05-10 15:49 被阅读0次
    $ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG002_1.fastq.gz | samtools view -@ 12 -bS | samtools sort -@ 12 -o HG002_1.minimap2.align.bam
    #或者可以用以下命令一步完成sam到bam,排序和索引
    $ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG002_1.fastq.gz | samtools sort -@ 12 -o HG002_1.minimap2.align.bam --write-index -
    
    #最终版本, samtools=1.18
    $ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG002_1.fastq.gz | samtools sort -@ 12 -o HG002_1.minimap2.align.bam --write-index -
    $ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG003.fastq.gz | samtools sort -@ 12 -o HG003.minimap2.align.bam --write-index -
    $ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG004.fastq.gz | samtools sort -@ 12 -o HG004.minimap2.align.bam --write-index -
    
    #最终版本, samtools=1.9
    $ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG002_1.fastq.gz | samtools view -@ 12 -bS | samtools sort -@ 12 -o HG002_1.minimap2.align.bam
    $ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG003.fastq.gz | samtools view -@ 12 -bS | samtools sort -@ 12 -o HG003.minimap2.align.bam
    $ minimap2 --MD -t 12 -ax map-hifi Human_ref/GRCh38.fa HG004.fastq.gz | samtools view -@ 12 -bS | samtools sort -@ 12 -o HG004.minimap2.align.bam
    #因为samtools=1.9没有sort没有--write-index选项
    

    对于minimap2的参数:

    -a Generate CIGAR and output alignments in the SAM format. Minimap2 outputs in PAF by default.
    --MD Output the MD tag (see the SAM spec).(后面sniffles软件需要MD tag)
    -t Number of threads CPU线程数.
    -x STR preset (always applied before other options; see minimap2.1 for details) .

    使用NGLMR比对

    ngmlr -t 10 -r /public/home/fengting/database/reference/rice/IRGSP-1.0_genome.fasta -q /public/home/fengting/data/hhz/H7L$i.arrow.polish.fasta -o /public/home/fengting/data/rihhz/H7L$i.sam
    picard SamFormatConverter -I $id.sam  -O bam/$id.bam
    ~/tools/samtools/samtools-0.1.19/samtools sort bam/$id.bam bam/$id.s
    
    #单样本分别检测变异
     sniffles -t 12 --input HG002_1.minimap2.align.bam --vcf HG002_1.vcf.gz --snf HG002_1.snf --tandem-repeats Human_ref/human_GRCh38_no_alt_analysis_set.trf.bed
     sniffles -t 12 --input HG003.minimap2.align.bam --vcf HG003.vcf.gz --snf HG003.snf --tandem-repeats Human_ref/human_GRCh38_no_alt_analysis_set.trf.bed
     sniffles -t 12 --input HG004.minimap2.align.bam --vcf HG004.vcf.gz --snf HG004.snf --tandem-repeats Human_ref/human_GRCh38_no_alt_analysis_set.trf.bed
    
    #joint calling
    $ sniffles --input HG002_1.snf HG003.snf HG004.snf --vcf multisample.vcf.gz
    

    Sniffles是一个用于检测结构变异(SVs)的工具,它主要用于长读长序列数据,如PacBio或Nanopore数据。以下是一些常用的Sniffles参数:

    1. -m/--min_support:指定支持阈值,即在结构变异(SV)检测中至少需要的读数支持数量。默认值为3。
    2. -s/--minmapqual:指定最小比对质量,即比对到基因组上的最小质量阈值。默认值为30。
      “-q”用于指定最小的Phred质量值阈值。Phred质量值是用于表示测序质量的一种常用的质量评分方式,通常在0-40的范围内,数值越高表示质量越好。在Sniffles中,参数“-q”可以用来过滤掉质量低于指定阈值的比对信息,以提高结构变异(SV)检测的准确性。
    3. -d/--minvar:指定结构变异(SV)的最小大小。默认值为50。
    4. -t/--threads:指定使用的线程数,可以加快处理速度。默认值为1。
    5. -I/--ignoreIllumina:忽略Illumina数据,只考虑长读长序列数据。
    6. -C/--cluster:指定聚类参数,用于将多个结构变异(SV)合并为单个事件。

    群call

    ls *sample.vcf > vcf_files_raw_calls.txt
    
    SURVIVOR merge vcf_files_raw_calls.txt 1000 1 1 -1 -1 -1merged.vcf
    
    
    sniffles -m ../sbam/az.s.bam -t 11  -v vcf/az.vcf  --Ivcf merged.vcf
    
    
    然后运行SURVIVOR:
    
    SURVIVOR merge vcf_files_gt_calls.txt 1000 -1 1 -1 -1 -1 merged_gt_SURVIVOR_1kbpdist_typesave.vcf
    
    (The -1 for the minimum SV caller is necessary to obtain all calls even if they might be 0/0 in all samples.)
    
    
    

    相关文章

      网友评论

          本文标题:三代测序数据结构变异检测

          本文链接:https://www.haomeiwen.com/subject/lbrefjtx.html