欢迎关注"生信修炼手册"!
分析体细胞突变时,通常采用tumor_vs_nomal 的实验设计。在检测时,由于同时会检测出生殖细胞突变和体细胞突变,需要做的就是去除生殖细胞突变位点,那么剩下的就是体细胞突变位点了,GATK4 采用Mutect2 检测体细胞突变,分析流程如下:
1. 根据normal 样本得到 panel of normal
首先对每个normal 样本,运行Mutect2
gatk Mutect2 \
-R reference.fa \
-I normal1.bam \
-tumor normal1_sample_name \
--germline-resource af-only-gnomad.vcf.gz \
-O normal1_for_pon.vcf.gz
然后使用CreateSomaticPanelOfNormals
命令创建panel of normal
gatk CreateSomaticPanelOfNormals \
-vcfs normal1_for_pon_vcf.gz \
-vcfs normal2_for_pon_vcf.gz \
-vcfs normal3_for_pon_vcf.gz \
-O pon.vcf.gz
2. normal_vs_turmor 得到体细胞突变
命令如下:
gatk Mutect2 \
-R reference.fa \
-I tumor.bam \
-tumor tumor_sample_name \
-I normal.bam \
-normal normal_sample_name \
--germline-resource af-only-gnomad.vcf.gz \
--af-of-alleles-not-in-resource 0.00003125 \
--panel-of-normals pon.vcf.gz \
-O somatic.vcf.gz
mutect2检测时,是成对检测的,需要一个normal bam 和 turmor bam, germline-resource
指定一个生殖细胞突变的vcf文件,这里选择的是gnomAD
数据库 ,链接如下
http://gnomad.broadinstitute.org
这个数据库收集了大量外显子和全基因组测序的SNP calling结果。af-of-alleles-not-in-resource
指定germline-resource
变异位点的频率,低于该频率的位点认为是一个不可靠的生殖细胞突变位点。panel-of-normals
指定第一步生成的pon.vcf.gz文件。
3. 过滤VCF文件
第一步,运行GetPileupSummaries
gatk-launch GetPileupSummaries \
-I tumor.bam \
-V small_exac_common_3.vcf \
-O pileups.table
第二步,运行CalculateContamination
gatk-launch CalculateContamination \
-I pileups.table \
-O contamination.table
第三步,运行FilterMutectCalls
gatk FilterMutectCalls \
-V somatic.vcf.gz \
-contamination-table contamination.table \
-O filtere
扫描关注微信号,更多精彩内容等着你!
网友评论
my $normal_vcfs = join " ", map { qq{-vcfs $_\.vcf.gz} } @normal_samples;
my $out_vcf = qq{out_vcf.gz};
my $command = qq{gatk CreateSomaticPanelOfNormals $normal_vcfs $out_vcf};
print qq{$command\n};