美文网首页bioinformatics
推断缺失的SNP基因型

推断缺失的SNP基因型

作者: 小潤澤 | 来源:发表于2022-03-30 13:44 被阅读0次

这是一篇发表在NG上的文章,讲述了当某一个个体缺乏SNP z的时候该如何推断出它的真实SNP基因型,《Genome-wide association studies of 14 agronomic traits in rice landraces》

比方说我们有100个个体(一倍体),那么有97个个体在SNP z这个位置上是call 得出来的,而在3个个体中是缺失的,那么我们的目的是infer出这三个个体中缺失的SNP

具体做法:
首先,确认我们要推断的SNP z,然后上下拓展相同的长度(该例子为上下拓展3bp),并定义为窗口 w 。对于个体 i 和个体 j 计算该 w 内的相似性分数,当两个major allele相同时,分数(sij为 1;当两个major allele有一个或两个都缺失时,分数(sij为 0;当两个major allele不同时,分数(sij为 p


那么这个窗口 w(针对SNP z) 的相似性为:

即窗口 w 内的分数总和

那么有N个个体对于窗口 w (针对SNP z)计算相似性分数,我们就可以得到一个矩阵:

针对窗口 w的相似性分数
例如S31代表个体 3 与个体 2 在窗口 w (针对SNP z)中的相似性分数

如果要推断个体 i SNP z的缺失值,我们需要取个体 i 与其他个体在窗口 w(针对SNP z)的相似性分数,并从大到小排序,取分数最大的前k-th定义为nearest neighbor

针对窗口 w的相似性分数
那么个体 i 缺失的SNP z基因型定义为窗口 w相似性分数最高的那个个体(比方Si25分数最高)对应位置(SNP z)的major allele(个体25 SNP z的major allele)

相关文章

  • 推断缺失的SNP基因型

    这是一篇发表在NG上的文章,讲述了当某一个个体缺乏SNP z的时候该如何推断出它的真实SNP基因型,《Genome...

  • plink - 关于提取某一个特定的SNP

    一、 查看某一个snp的基因型频率 如果要计算全部snp频率则去掉“--snp rs10402893”命令就好 二...

  • vcftools过滤SNP数据2021-02-25

    一、计算每个SNP缺失频率 获得的SNP_missing结果,最后一栏为缺失率: 二、过滤掉缺失率大于10%和非b...

  • 11.2 GWAS流程学习

    主要使用plink和structure: 1、在snp-calling后得到vcf文件 2、基因型填充: http...

  • 去除文本中全0或者全1的行

    我们在做数据分析的时候,偶尔会遇到这样的问题,比如把基因型纯合杂合分别编码为0 1 2,当某一个snp基因型全是1...

  • 甲基化数据QC: 使用甲基化数据推测SNP基因型(ewastoo

    介绍一下如何使用ewastools推测甲基化数据的SNP基因型 下载、安装ewastools 以下例子是ewast...

  • 缺失基因型填充

    作者:陈美佳 一、问题描述 基因型数据的缺失分为遗传性缺失和检测性缺失: 1、遗传性缺失:个体遗传信息的变异(例如...

  • AmyTree算法

    1. input要求:四个文件,Y-SNP基因型, 树文件, 编译名称文件,参考序列 2. Call Qualit...

  • GWAS分析

    首先准备输入文件(vcf文件和表型文件) 基因型推断 格式转换 会生成 tfam、tped、map文件根据tfam...

  • admixture 群体结构分析

    tructure是与PCA、进化树相似的方法,就是利用分子标记的基因型信息对一组样本进行分类,分子标记可以是SNP...

网友评论

    本文标题:推断缺失的SNP基因型

    本文链接:https://www.haomeiwen.com/subject/cxnijrtx.html