美文网首页
linux:文本处理系列-1.行截取

linux:文本处理系列-1.行截取

作者: 树懒吃糖_ | 来源:发表于2019-12-18 17:19 被阅读0次

    (自己)常用的文本文件的行处理命令

    示例文件:test.vcf
    1、head -n 10 test.vcf
    head : 默认是提取文件的前10行,-n 参数可以设定选择文件的前n行

    2、tial -n 10 test.vcf
    tail : 默认是提取文件的末尾10行, -n 参数可以设定选择文件末尾的n行

    3、sed -n '10,20p' test.vcf
    sed -n : 随意选择需要查看的行
    sed命令是一个面向行处理的编辑器,可以和正则表达式配合使用,附上较全面的sed命令使用教程。
    https://man.linuxde.net/sed

    4、awk 截取行的指定长度字符串
    less test.gz |awk '{if(NR%2==1){print}else{print substr($1,1,75)}}' | gzip -c > test.part.gz
    说明:对test.gz文件指定行截取75bp,原来是150bp

    5、对n行的第三列求和,求平均值
    grep -v ‘#’ test.vcf |sed -n '20,35p' |awk -F '\t' '{sum+=$3;n++}END{print sum,sum/n}'
    (linux 一行命令计算速度比Python快,简单计算喜欢用linux命令)
    记得随时整理使用过的命令,没学过linux,靠着各种帖子,随时需要随时补给,有点懒。

    相关文章

      网友评论

          本文标题:linux:文本处理系列-1.行截取

          本文链接:https://www.haomeiwen.com/subject/ywpunctx.html