Tools for phasing genotypes in a VCF file:
#1
Also, our free Mega2 software can read VCF as input and convert to a variety of formats. See [http://watson.hgen.pitt.edu/mega2.html](https://www.researchgate.net/deref/http%3A%2F%2Fwatson.hgen.pitt.edu%2Fmega2.html) for more detail.
#2
You can use p-link ([http://pngu.mgh.harvard.edu/~purcell/plink/](https://www.researchgate.net/deref/http%3A%2F%2Fpngu.mgh.harvard.edu%2F~purcell%2Fplink%2F)) or R package for your work.
#3
I suggest BEAGLE version 4\. See the web page for the manual and download.
[http://faculty.washington.edu/browning/beagle/beagle.html](https://www.researchgate.net/deref/http%3A%2F%2Ffaculty.washington.edu%2Fbrowning%2Fbeagle%2Fbeagle.html)
#4
[https://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html](https://www.researchgate.net/deref/https%3A%2F%2Fmathgen.stats.ox.ac.uk%2Fgenetics_software%2Fshapeit%2Fshapeit.html)
为什么要Phasing
因为Phasing很重要。Phasing的重要性可以分为两个方面。一方面, Phasing与遗传变异的功能诠释密切相关。这体现在遗传咨询师或者科学家需了解基因突变的相位后, 才能更好地判断基因突变是否会产生临床表型。比如在一个基因上发生多个Loss of function variants(LOF),通常当这些变异出于不同的单倍型时(这称为trans-configuration),即两个拷贝的姐妹基因都发生了变异, 才会导致基因表达计量(Gene expression dosage)的错误且产生危害。而当它们出于同一个单倍型时(这称为cis-configuration),因为还有一个正常拷贝的基因(作为备胎), 基因表达很可能不会发生改变也不会产生危害。
另一方面, Phasing在遗传学研究中也有诸多应用,具体如下:
第一、人群Phasing后形成的单倍型参考序列集(Reference panel)是基因型推断(Imputation)必须的数据材料。而基因型推断(Imputation)是基因型-表型关联分析研究中必不可少的环节。高质量的Reference Panel能提升关联分析的统计功效;
第二、除了Reference Panel的制造需要使用Phasing技术之外,对被研究的对象进行预先Phasing(Pre-phasing)也可以极大地提高基因型推断(Imputation)的准确性;
第三、使用多个位点组成的Haplotype,而不是简单的单位点基因型, 可实现群体遗传历史的推断;
第四、可通过Phased后的家系人群单倍型序列,估算染色体重组率、重组热点等重要遗传参数;
第五、Phasing可用于探测频发突变、选择信号以及基因表达的顺势调控。
网友评论