美文网首页
使用bioawk对基因组fasta序列ID(染色体/scaffo

使用bioawk对基因组fasta序列ID(染色体/scaffo

作者: 生物信息与育种 | 来源:发表于2021-04-22 18:09 被阅读0次

需求

已知某基因组序列,染色体或scaffold ID顺序不定,想要对其按数字排序。


image.png

原顺序:


image.png

想要的排序结果:


image.png

实现

使用bioawk,没有的话conda直接安装。

bioawk -c fastx '{print}' old.genome.fa |  \
  sort -k1,1V | awk '{print ">"$1;print $2}' >new.genome.fa

https://www.biostars.org/p/494201/

相关文章

网友评论

      本文标题:使用bioawk对基因组fasta序列ID(染色体/scaffo

      本文链接:https://www.haomeiwen.com/subject/uaefrltx.html