-
MAF文件是TCGA中以project为单位进行突变存储的文件,官网是说,large cohort使用;
-
相应的call突变流程有四种:MuSE Variant Aggregation and Masking、MuTect2 Variant Aggregation and Masking、SomaticSniper Variant Aggregation and Masking和VarScan2 Variant Aggregation and Masking
-
而且在GDC的Exploration中,有针对每个突变的damage的预测,且可以针对位点进行生存分析;
20190908221601.png -
maf文件中的突变damage预测主要涉及到了三个软件:SIFT、PolyPhen和VEP。
-
SIFT (sorting intolerant from tolerant)
-
基于序列同源性和氨基酸的物理特性对氨基替换是否会影响蛋白功能进行预测
-
可用于天然存在的非同源突变和诱导产生的错义突变的预测
-
思路:
-
搜索相似的序列
-
选择可能与查询序列具有相似功能的密切相关的序列
-
获得这些所选序列的比对
-
计算来自比对的所有可能替换的归一化的概率
-
-
预测的归一化概率小于0.05为有害,大于等于0.05为可容忍
网友评论