美文网首页群体遗传学
4.2 基因型数据描述性统计

4.2 基因型数据描述性统计

作者: Wei_Sun | 来源:发表于2022-08-16 12:20 被阅读0次

    完成标记开发后,会得到基因型数据,首先要对基因型数据进行统计,用到的工具是plink,安装及基础用法见链接:
    plink安装及基础用法 - 简书 (jianshu.com)

    统计主要包括标记水平和个体水平两部分:

    • 标记水平:缺失率、杂合率、等位基因频率;
    • 个体水平:缺失率、杂合率。

    输入

    $ ./plink --allow-extra-chr --freq --hardy --missing --het --vcf genotype.vcf
    

    --allow-extra-chr:允许额外染色体编号
    --freq:最小等位基因频率
    --hardy:标记杂合度
    --missing :标记与个体水平缺失率
    --het :个体纯合基因型数目
    --vcf :指定 VCF 文件为.vcf,也可以是压缩格式.vcf.gz

    输出

    plink.frq:标记最小等位基因频率 MAF


    plink.hwe:标记杂合度 O(HET)



    plink.lmiss: 标记缺失率 F_MISS



    plink.imiss:个体缺失率 F_MISS

    plink.het:个体纯合度 O(HOM) / N(NM)


    引用转载请注明出处,如有错误敬请指出。

    相关文章

      网友评论

        本文标题:4.2 基因型数据描述性统计

        本文链接:https://www.haomeiwen.com/subject/nebrgrtx.html