IBD与IBS均是,基于遗传信息,表示样本对之间亲缘关系的指标,具体定义如下:
血缘同源(Identity By Descent,IBD),子代中共有的等位基因来源于同一祖先。
状态同源(identical by state ,IBS),两个个体拥有相同的等位基因(不一定来源以同一祖先)。
通常IBD无法直接观测,但IBS可以通过两个体基因型算出。
个体 1个体2IBS
AAAA2
AAAa1
AAaa0
在某一基因座,两个体可能有 0个,1个,或2个相同的等位基因
IBD可以让我们了解两个体间的亲缘关系,虽然无法直接测得,但可以根据IBS以及等位基因频率的分布来推定。
PLINK中使用 PI_HAT 值来推定IBD的值。该方法基于隐马尔科夫模型 hidden Markov model (HMM),通过矩估计(method-of-moments)来计算 IBD=1, 2或0 的概率。
PI_HAT:为IBD比例 , 即 P(IBD=2) + 0.5*P(IBD=1),PI_HAT的值与对应关系如下所示:
PI_HAT=0 无亲缘关系
PI_HAT=0.25 表兄弟
PI_HAT=0.5 亲子或兄弟姐妹
PI_HAT=1 本人或同卵双胞胎
PLINK1.9中提供了–genome的选项,以计算 PI_HAT (注意,计算前强烈建议对SNP进行pruning)
plink --vcf All.save1326.Refilter.miss0.2maf0.05.recode.vcf.gz --const-fid --allow-extra-chr --indep-pairwise 1000 50 0.2 --genome --out IBD_result
输出文件会被写进 .genome的文件中,每一列的内容如下
FID1 Family IDforfirst sampleIID1 Individual IDforfirst sampleFID2 Family IDforsecond sampleIID2 Individual IDforsecond sampleRT Relationshiptypeinferred from .fam/.ped fileEZ IBD sharing expected value, based on just .fam/.ped relationshipZ0 P(IBD=0)Z1 P(IBD=1)Z2 P(IBD=2)PI_HAT Proportion IBD, i.e. P(IBD=2)+ 0.5*P(IBD=1)PHE Pairwise phenotypic code(1, 0, -1=AA, AU, and UU pairs, respectively)DST IBS distance, i.e.(IBS2 + 0.5*IBS1)/(IBS0 + IBS1 + IBS2)PPC IBS binomialtestRATIO HETHET : IBS0 SNP ratio(expected value 2)
网友评论