awk小结

作者: output | 来源:发表于2017-04-09 08:59 被阅读25次

    awk

    参考 AWK简明教程|coolshell

    文本

    cat netstat.txt
    Proto Recv-Q Send-Q Local-Address          Foreign-Address             State
    tcp        0      0 0.0.0.0:3306           0.0.0.0:*                   LISTEN
    tcp        0      0 0.0.0.0:80             0.0.0.0:*                   LISTEN
    tcp        0      0 127.0.0.1:9000         0.0.0.0:*                   LISTEN
    tcp        0      0 coolshell.cn:80        124.205.5.146:18245         TIME_WAIT
    tcp        0      0 coolshell.cn:80        61.140.101.185:37538        FIN_WAIT2
    tcp        0      0 coolshell.cn:80        110.194.134.189:1032        ESTABLISHED
    tcp        0      0 coolshell.cn:80        123.169.124.111:49809       ESTABLISHED
    tcp        0      0 coolshell.cn:80        116.234.127.77:11502        FIN_WAIT2
    tcp        0      0 coolshell.cn:80        123.169.124.111:49829       ESTABLISHED
    tcp        0      0 coolshell.cn:80        183.60.215.36:36970         TIME_WAIT
    tcp        0   4166 coolshell.cn:80        61.148.242.38:30901         ESTABLISHED
    tcp        0      1 coolshell.cn:80        124.152.181.209:26825       FIN_WAIT1
    tcp        0      0 coolshell.cn:80        110.194.134.189:4796        ESTABLISHED
    tcp        0      0 coolshell.cn:80        183.60.212.163:51082        TIME_WAIT
    tcp        0      1 coolshell.cn:80        208.115.113.92:50601        LAST_ACK
    tcp        0      0 coolshell.cn:80        123.169.124.111:49840       ESTABLISHED
    tcp        0      0 coolshell.cn:80        117.136.20.85:50025         FIN_WAIT2
    tcp        0      0 :::22                  :::*                        LISTEN
    

    输出第1列与第4列

    # 单引号中的被大括号括着的就是awk语句,只能被单引号包含
    # $1...$n表示第几列,$0表示整行
    awk '{print $1, $4}' netstat.txt
    

    格式化

    # 和C语言的printf一样
    awk '{printf "%-8s %-8s %-8s %-18s %-22s %-15s\n",$1,$2,$3,$4,$5,$6}' netstat.txt
    

    过滤记录

    awk '$3==0 && $6=="LISTEN"' netstat.txt # 第3列为0,第6列为LISTEN
    awk '$3>0 {print $0}' netstat.txt
    awk '$3==0 && $6=="LISTEN" || NR==1 ' netstat.txt # NR是内建变量
    awk '$3==0 && $6=="LISTEN" || NR==1 {printf "%-20s %-20s %s\n",$4,$5,$6}' netstat.txt
    
    # 结合内建变量输出行号
    awk '{printf "%02s %s %-20s %-20s %s\n",NR, FNR, $4,$5,$6}' netstat.txt
    

    内建变量

    变量 说明
    $0 当前记录(这个变量中存放着整个行的内容)
    $1~$n 当前记录的第n个字段,字段间由FS分隔
    FS 输入字段分隔符 默认是空格或Tab
    NF 当前记录中的字段个数,就是有多少列
    NR 已经读出的记录数,就是行号,从1开始,如果有多个文件话,这个值也是不断累加中。
    FNR 当前记录数,与NR不同的是,这个值会是各个文件自己的行号
    RS 输入的记录分隔符, 默认为换行符
    OFS 输出字段分隔符, 默认也是空格
    ORS 输出的记录分隔符,默认为换行符
    FILENAME 当前输入文件的名字

    指定分隔符

    awk 'BEGIN{FS=":"} {print $1,$3,$6}' /etc/passwd
    awk -F: '{print $1,$3,$6}' /etc/passwd
    awk -F '[;:]' # 指定多个分隔符
    awk -F: '{print $1,$3,$6}' OFS="\t" /etc/passwd # 指定输出的分隔符
    

    字符串匹配

    # 第一个示例匹配FIN状态, 第二个示例匹配WAIT字样的状态。
    # ~ 表示模式开始。/ /中是模式。这就是一个正则表达式的匹配。
    awk '$6 ~ /FIN/ || NR==1 {print NR,$4,$5,$6}' OFS="\t" netstat.txt 
    awk '$6 ~ /WAIT/ || NR==1 {print NR,$4,$5,$6}' OFS="\t" netstat.txt
    
    # awk可以像grep一样的去匹配第一行
    awk '/LISTEN/' netstat.txt
    
    # 使用 “/FIN|TIME/” 来匹配 FIN 或者 TIME
    awk '$6 ~ /FIN|TIME/ || NR==1 {print NR,$4,$5,$6}' OFS="\t" netstat.txt
    
    # 模式取反
    awk '$6 !~ /WAIT/ || NR==1 {print NR,$4,$5,$6}' OFS="\t" netstat.txt
    awk '!/WAIT/' netstat.txt
    

    相关文章

      网友评论

          本文标题:awk小结

          本文链接:https://www.haomeiwen.com/subject/wuxdattx.html