结构变异(Structural variation),又称为基因体结构变异,是生物染色体上结构的变异,由一个物种基因体中的多种变异所组成,通常包括微观和亚微观类型,如缺失、重复、拷贝数变异、插入、倒位和易位等。过去讨论结构变异,多指涉长度介于1Kb与3Mb之间的序列,大于单核苷酸多态性并且小于染色体畸变(虽然就定义上有一些重叠)[1],但随着全基因组测序技术的发达,现在结构变异的定义已扩大为大于50b的序列[2]。结构变异不一定会影响表现型,有些结构变异与遗传疾病有关,但也有许多与其无关。[3][4]近期有关结构变异的研究发现结构变异比单核苷酸多态性更难检测。正常人群的基因组中,约有13%的区域为结构变异,而且至少有240个基因有同型合子缺失的情形,意味着这些基因可能在人类是非必需的。[4]
全基因组关联分析(Genome-wide association study)是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs
GWAS为人们打开了一扇通往研究复杂疾病的大门,将在患者全基因组范围内检测出的SNP位点与对照组进行比较,找出所有的变异等位基因频率,从而避免了像候选基因策略一样需要预先假设致病基因。同时,GWAS研究让我们找到了许多从前未曾发现的基因以及染色体区域,为复杂疾病的发病机制提供了更多的线索。
基于无关个体的关联分析
- 病例对照研究设计:主要用来研究质量性状,即是否患病。
- 基于随机人群的关联分析:主要用来研究数量性状。
VCF文件含义的详细介绍
https://samtools.github.io/hts-specs/VCFv4.3.pdf
https://www.jianshu.com/p/957efb50108f
网友评论