近期再一次回顾和学习了下SNP芯片HLA填充,发现近两年有几个新的软件出来,文章发表的也不错,在这里分享一下!
CookHLA
与以前的方法相比,CookHLA大大提高了插补的准确性,包括通过实施多项更改的前身SNP2HLA。首先,为了提高准确性和效率,我们采用了最近发布的隐马尔可夫模型(Beagle v4和v5)。其次,为了进一步提高准确性,我们开发了一种可以解释HLA基因外显子局部变异的程序。高度多态性外显子(I类中的外显子2/3/4和II类中的2/3)是关键区域,其序列可以决定大多数4位等位基因。在我们的方法中,我们通过将标记集局部放置在每个高度多态的外显子中来重复插补,并使用重复分析的共识后验概率进行最终预测(图B)。第三,为了进一步提高准确性,我们从数据中自适应地学习MHC的遗传图谱。该图谱信息使我们能够解释MHC内特定于数据的LD结构,与使用公开的遗传图谱相比,这提高了插补的准确性(图C)。
个人测试发现它的缺点是多了一步,增加了参考生成的难度和出错的可能性。
DEEP-HLA
DEEP*HLA是一种基于Python中实现的多任务卷积神经网络的HLA等位基因插补方法。
DEEP*HLA接收预分期SNV数据并输出二元HLA等位基因的基因型剂量。
在DEEP*HLA中,HLA 插补在两个过程中形成:
(1) 使用 HLA 参考面板进行模型训练
(2)使用经过训练的模型进行插补。
最近大火的chatGPT让每个人了解了AI正在成为我们的好(取)帮(代)手(者),有人说打败我们的不是AI,是使用AI的人,所以用起这个AI的HLA工具吧!个人体验,软件安装依赖有问题,这也是开源软件的弊端啦!
HLA-TAPAS
HLA-TAPAS(HLA-Type at Protein for Association Studies)是一个以HLA为中心的管道,可以处理HLA参考面板构建(MakeReference),HLA插补(SNP2HLA)和HLA关联(HLAassoc)。
简而言之,主要更新包括
(1) 使用 PLINK-v1.9 代替 v1.07;
(2) 使用 BEAGLE v4.1 代替 v3 进行定相和插补;和
(3) 包括自定义 R 脚本,用于在多个祖先中执行关联和精细映射分析。
个人体会这个软件是一个流程,比较全面的解决方案,还未试用!
Michigan Imputation Server
多种族HLA小组由五个全球种群的36,586个单倍型组成。我们以 two-field (four-digit) and G-group分辨率发布了该面板。
个人感觉这个的缺点是多数是欧美人,中国人的数据比较少。
PGG.MHC--人类主要组织相容性复合体基因数据库和分析平台
这个前面提过,这里不再重复!
PGG.MHC--人类主要组织相容性复合体基因数据库和分析平台
网友评论