美文网首页重测序及SNP分析
GATK4 非Spark模式运行

GATK4 非Spark模式运行

作者: 爱吃海椒的妹妹 | 来源:发表于2022-03-16 10:53 被阅读0次

    GATK4 非Spark模式运行

    更新时间:2022-02-15 GMT+08:00

    查看PDF

    [分享](javascript:void(0);)

    操作步骤

    1. 使用PuTTY工具,以root用户登录服务器。
    2. 执行以下命令,BWA index对fasta文件构建索引。
    bwa index -a bwtsw human_g1k_v37.fasta
    
    1. 执行以下命令,BWA mapping对fastq文件进行比对。
    gatk CreateSequenceDictionary -R human_g1k_v37.fasta -O human_g1k_v37.dict
    
    bwa mem -M -t 64 human_g1k_v37.fasta SRR742200_1.fastq SRR742200_2.fastq > SRR7.sam
    
    1. 执行以下命令,Reorder对基因序列进行重新排序。
    gatk ReorderSam -I SRR7.sam -O SRR7_reorder.bam -R human_g1k_v37.fasta
    
    1. 执行以下命令,Sort对基因序列按照坐标顺序从大到小排序。
    gatk SortSam -I SRR7_reorder.bam -O SRR7_sorted.bam --SORT_ORDER coordinate
    
    1. 执行以下命令,Add head对基因序列进行加头处理。
    gatk AddOrReplaceReadGroups -I SRR7_sorted.bam -O SRR7_addhead.bam -LB lib1 -PL illumina -PU unit1 -SM 20
    
    1. 执行以下命令,Mark Duplicates对基因序列去重。
    gatk MarkDuplicates -I SRR7_addhead.bam -M test.metric -O SRR7_markdup.bam
    
    1. 执行以下命令,BQSR进行重新校准。
      1. 执行以下命令对fasta参考文件进行重新排列生成fai文件。
    samtools faidx human_g1k_v37.fasta > human_g1k_v37.fai
    
    2.  执行以下命令给vcf文件加index。
    
    gatk IndexFeatureFile -F dbsnp132_20101103.vcf
    
    gatk BaseRecalibrator -I SRR7_markdup.bam --known-sites dbsnp132_20101103.vcf -O SRR7_bqsr.bam -R human_g1k_v37.fasta
    
    gatk ApplyBQSR -bqsr SRR7_bqsr.bam -I SRR7_markdup.bam -O SRR7_aybqsr.bam
    
    1. 执行以下命令,HaplortypeCaller变异流程检测。
    gatk HaplotypeCaller -I SRR7_aybqsr.bam -O SRR7_raw.vcf -R human_g1k_v37.fasta
    

    转载自:
    GATK4 非Spark模式运行鲲鹏BoostKit HPC使能套件移植指南(开源组件)其他GATK 4.0.0.0 移植指南(CentOS 7.6)运行和验证华为云 (huaweicloud.com)

    相关文章

      网友评论

        本文标题:GATK4 非Spark模式运行

        本文链接:https://www.haomeiwen.com/subject/lxqpdrtx.html