之前讲了太多的很细的数据分析和过滤,在实战中,一般可以把命令写在一起。
total这张图片对比了数据summary和数据过滤的命令之间的差异。
对于我们自然群体,没有家系结构,所以主要是
--mind N 删个体(基于缺失率)
--geno N 删snp(基于缺失率)
--maf N 删snp (基于最小等位基因频率)
--hwe N 删snp (基于A和a不符合哈德温伯格平衡)
--LD(这个一般不做双基因互作的话不考虑,详见我上一篇)
plink --bfile core_v0.7 --mind 0.1 --maf 0.05 --geno 0.1 --hwe 0.01 --make-bed --out clean
这样可以生成过滤好的文件,进行下一步分析
生成的新文件
clean
网友评论