美文网首页
生物信息学中可能用到的几个awk操作命令

生物信息学中可能用到的几个awk操作命令

作者: 2b17a8a8f301 | 来源:发表于2018-11-15 22:23 被阅读0次

awk作为强大的文本分析工具其功能十分强大。

其语法结构为 :awk “{pattern + action}” {filename}

for example:

1.输出任意一列数据

awk "{print $n}" filename

其中n表示域,分割域的默认符是空格或者Tab

2.可过滤数据,比如输出第n域大于80和第m域小于20的数据

awk “{if($n>80&&$m<20) print$0}" filename

3.利用正则表达式数据输出符合要求的数据,即匹配输出

awk “$0 requirement{print $0}" filename 

4.输出固定行

awk ” requirement“ filename

5.合并文件

awk ”BEGIN{while((getline<"filename1")>0)1[$1]=$0}$1 in 1{print $0"\t"1[$1]}" filename2

6.fastq转换fasta

awk “{getline seq ; getline plus ; getline qual ; sub("@".">",$) ; print $0 "\n"seq}" filename

补充一个sed命令:

sed -n "xxx" filename(输出第几行)

sed -n ”xxx-yyy" filename(输出第xxx-yyy行)

就简单介绍这几个,其他的在使用的时候可以再自行搜索。

相关文章

  • 生物信息学中可能用到的几个awk操作命令

    awk作为强大的文本分析工具其功能十分强大。 其语法结构为 :awk “{pattern + action}” {...

  • Linux

    linux awk命令详解、linux awk命令Linux常用操作指令Linux netstat命令详解 awk...

  • Shell 脚本绘图实例使用gnuplot

    日志的格式: 日志的搜索用到了grep 命令, 提取文本列用到了 awk 命令,文本替换 sed命令,cut 也可...

  • 20170904 awk

    awk介绍awk变量printf命令:实现格式化输出操作符awk patternawk actionawk数组aw...

  • [linux] awk

    Overview awk是一个强大的文本处理工具,尽管操作可能会很复杂,但命令的语法始终是:awk '{patte...

  • 生物信息学中常用的linux命令(一)

    linux命令非常多,但在生物信息学中经常用到的linux命令也就十几个,这些命令主要是用在两个方面 目录和文件管...

  • 2019-07-25

    操作系统命令三剑客-awk 一: 三剑客命令awk概述gawk : pattern scanning and pr...

  • 35.《Bioinformatics Data Skills》之

    作为表格文本处理命令awk的延伸,Heng Li开发了专门处理生物信息学的文件(例如bed, sam, vcf, ...

  • 文字处理

    Linux 下进行字符串操作最常用的三个命令: awk (检索) sed (编辑) grep (匹配) awk 语...

  • Day3--vim遇上perl

    ---------------vim的学习-------------------- 只是学习了几个可能用到的命令。...

网友评论

      本文标题:生物信息学中可能用到的几个awk操作命令

      本文链接:https://www.haomeiwen.com/subject/ckwsfqtx.html