Polysolver是目前用的最广泛的可以做HLA分型的工具之一,它还可以寻找HLA中肿瘤相关突变(不知道是不是唯一的工具)。近年来越来越多的肿瘤免疫逃逸机制被发现,HLA位点的突变是其中的一种。举个例子,下图是TCGA泛癌研究中从12种癌症2545个病例中用polysolver找到的HLA肿瘤相关突变,可以看到对实体瘤,某些癌症有多到10%的样本(头颈癌)中发现HLA肿瘤相关突变。鉴于其对某些癌种的免疫治疗有相当的指导意义,今天来跑一下流程。
Screen Shot 2021-04-15 at 9.41.00 PM.png软件安装推荐下载其docker,也可以用conda安装。
$ docker pull sachet/polysolver:v4
主要流程分三步:
- HLA-A,-B,-C的分型。这里我们就用其自带的测试数据test.bam做测试。几个参数要设置:
bam: normal bam file
race: 人种,贝叶斯算法prior考虑不同人种中不同HLA分型的概率
includeFreq: 1考虑人种HLA分型概率; 0不考虑人种HLA分型概率
build: genome build
format: standard fastq
insertCalc: 0不考虑测序插入片段长度prior概率
outDir: 输出结果文件夹
$ Usage: shell_call_hla_type bam race includeFreq build format insertCalc outDir
$ shell_call_hla_type polysolver/test/test.bam Unknown 1 hg19 STDFQ 0 output
结果是文件winners.hla.txt,可以看到精度很高。
HLA-A hla_a_24_02_01_01 hla_a_24_02_01_01
HLA-B hla_b_39_01_01_02l hla_b_39_01_01_03
HLA-C hla_c_07_01_05 hla_c_12_02_05
- 检测肿瘤样本中HLA locus的突变, SNV用的是Mutect,INDEL用的是Strelka。参数很容易理解,就是call体细胞突变。
shell_call_hla_mutations_from_type polysolver/test/test.bam polysolver/test/test.tumor.bam output/winners.hla.txt hg19 STDFQ output
可以看到对每个HLA分型都有SNV和INDEL的结果文件,如果没有突变则文件为空。
Screen Shot 2021-04-15 at 9.05.13 PM.png- 突变的注释。这里indiv结果文件的前缀,可以更改为自己想要的名字。
shell_annotate_hla_mutations indiv output
SNV得到四个文件,INDEL得到三个文件。其中带有ambiguous的文件需要注意的是这里面的突变出现在两个或以上的allele上并且allele frequency(VAF)相同。
Screen Shot 2021-04-15 at 9.18.40 PM.png最厚在这个测试数据中找到了两个肿瘤相关突变,都在HLA-B上。
Screen Shot 2021-04-15 at 9.29.21 PM.png
References:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4747795/
https://software.broadinstitute.org/cancer/cga/polysolver
网友评论