美文网首页
2022-12-24vcf文件获取样品名称,染色体名称,修改

2022-12-24vcf文件获取样品名称,染色体名称,修改

作者: dashan1928 | 来源:发表于2022-12-23 10:18 被阅读0次

    vcf-query -l xx.vcf

    在进行admixture运算时,需要染色体名称为整数,常需要提取vcf文件中的染色体名称,并进行修改,需要以下几步。

    第一步:提取vcf中染色体名称

    awk '{print $1}'  xxx.vcf | grep '^[^#]' > chr.txt

    第二步:将染色体的名称进行修改,如果染色体均以chr开头则说明没有未组装到染色体上的scaffold,若有未组装到染色体上的scaffold,则这些scaffold 用0 进行替代

    awk '{print $1 "\t" $1}' chr.txt | awk  'gsub(/chr/,"",$2)' > chr_rename.txt

    有unplaced scaffold则把原先chr.txt 分为两部分,再替换后,再合并成一个文件

    第三步:利用bcftools 中的 annotate 命令修改染色体名称

    bcftools annotate --rename-chr chr_rename.txt xxx.vcf > new_chr.vcf

    第四步:计算admixture中的最佳k值

    for K in {1..10}; do admixture --cv rads.bed $K | tee log${K}.out; done

    相关文章

      网友评论

          本文标题:2022-12-24vcf文件获取样品名称,染色体名称,修改

          本文链接:https://www.haomeiwen.com/subject/wzmbqdtx.html