美文网首页
sort配合awk对 GTF文件进行重新排序

sort配合awk对 GTF文件进行重新排序

作者: 倚剑听雨喧 | 来源:发表于2018-01-11 15:24 被阅读0次

    Hello,我是倚剑听雨,每日随手更新~带你看生信小白的日常!

    如果你也打算在 hg19的 GTF 文件里添加 tRNA和 rRNA 的数据。

    首先,tRNA 数据可以在GENCODEGRCh38.p10版本中下载Predicted tRNA genes。

    其次,rRNA 的5s 5.8s 28s 18s 来自https://en.wikipedia.org/wiki/Ribosomal_RNA的前四个Reference。

    使用 cat 命令可以合并两个 GTF 文件

    cat A B > C

    不过 GTF 往往必须经过排序才可以使用。比对hg19的 GTF发现其 GTF 格式先按照染色体排序,然后相同的染色体又对 Start position,也就是第四列进行排序。

    通过使用sort配合awk可以简单的实现对 GTF 文件的排序。下面是我的代码

    cat A.gtf | awk -F '\t' -v OFS=',' '{$1=$1;print}' | sort -t, -k1,1 -k4,5n | awk -F ',' -v OFS='\t' '{$1=$1;print}' > A.sorted.gtf &

    注意:请确保你的 GTF 文件是 tab 键分隔,否则请改变 awk 的分隔符参数-F

    转载请注明出处,违者必究。

    相关文章

      网友评论

          本文标题:sort配合awk对 GTF文件进行重新排序

          本文链接:https://www.haomeiwen.com/subject/iraznxtx.html