美文网首页LINUX学生会linux学习
Linux基础之三剑客AWK进阶

Linux基础之三剑客AWK进阶

作者: 数据革命 | 来源:发表于2017-07-17 11:16 被阅读46次
    • 上篇已经讲了AWK基础篇
    • 这篇开始讲进阶

    awk工作原理

    • 一次读取一行文本,按输入分隔符进行切片,切成多个组成部分,将每片直接保存在内建的变量中,$1,$2,$3….,引用指定的变量,可以显示指定断,或者多个断。如果需要显示全部的,需要使用$0来引用
    • 可以对单个片断进行判断,也可以对所有断进行循环判断
    • 其默认分隔符为空格

    awk PATTERN

    • PATTERN:根据pattern条件,过滤匹配的行,再做处理
    • 格式 awk [option] 'pattern{action}' file
    • 那什么是PATTERN
    • 如果有一个文件 ,这个文件每读入一行,PATTERN就会根据条件做过滤处理
    • 如正则表达式,如果符合条件他就会进入action进去处理
    • 如果不符合他就不管他,接着读取另外一行,以此类推

    不过PATTERN有多种写法

     - 如果为指定:空模式,匹配每一行 ,意思就是说不写PATTERN,只写action
     - 示例
    
         [root@localhost ~]# awk -F: '{print $1,3}' /etc/passwd
    root 3
    bin 3
    daemon 3
    adm 3
    lp 3
    sync 3
    shutdown 3
    halt 3
    mail 3
    operator 3
    games 3
    ftp 3
    nobody 3
    systemd-bus-proxy 3
    systemd-network 3
    dbus 3
    polkitd 3
    colord 3
    abrt 3
    
    • 我没有写PATTERN,所以他会对所有行的第一和第三行打印出来,这就是空模式,匹配每行

    • 正则表达式的限定,/regular expression/:仅处理能够模式匹配到的行,需要用/ /括起来

    • 示例

    [root@localhost ~]# awk  /^UUID/ /etc/fstab 
    UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 /                       xfs     defaults        0 0
    UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot                   xfs     defaults        0 0
    UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr                    xfs     defaults        0 0
    UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap                    swap    defaults        0 0
    
    • 我没有填写print 那是因为默认自动打印$0,就算我写了也一样,想取什么,就取什么
    [root@localhost ~]# awk  '/^UUID/ {print $0  }' /etc/fstab 
    UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 /                       xfs     defaults        0 0
    UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot                   xfs     defaults        0 0
    UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr                    xfs     defaults        0 0
    UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap                    swap    defaults        0 0
    
    • 还可以取反哦
      [root@localhost ~]# awk '!/^UUID/ {print $0 }' /etc/fstab
    #
    # /etc/fstab
    # Created by anaconda on Thu Jul 13 08:26:25 2017
    #
    # Accessible filesystems, by reference, are maintained under '/dev/disk'
    # See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
    #
    
    • 甚至我还可以拿他来取磁盘分区使用列表哦
    [root@localhost ~]# df| awk '/^\/dev\/sd/ {print $5}'
    1%
    13%
    30%
    
    • relational expression: 关系表达式,结果为“真”才会被处理
    • 真:结果为非0值,非空字符串
    • 假:结果为空字符串或0值
    • 意思就是只要不是为0都打印,为0就不打印
    • 示例
    [root@localhost ~]# awk -F: '"" {print $0  }' /etc/fstab  
    
    • 没打印如果给他个任意字符串
    [root@localhost ~]# awk -F: '"rrr" {print $0  }' /etc/fstab 
    
    #
    # /etc/fstab
    # Created by anaconda on Thu Jul 13 08:26:25 2017
    #
    # Accessible filesystems, by reference, are maintained under '/dev/disk'
    # See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
    #
    UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 /                       xfs     defaults        0 0
    UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot                   xfs     defaults        0 0
    UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr                    xfs     defaults        0 0
    UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap                    swap    defaults        0 0
    

    line ranges:行范围

    • startline,endline:/pat1/,/pat2/ 不支持直接给出数字格式
    • 示例
    [root@localhost ~]# awk -F: '/^b/,/^f/' /etc/passwd
    bin:x:1:1:bin:/bin:/sbin/nologin
    daemon:x:2:2:daemon:/sbin:/sbin/nologin
    adm:x:3:4:adm:/var/adm:/sbin/nologin
    lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
    sync:x:5:0:sync:/sbin:/bin/sync
    shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
    halt:x:7:0:halt:/sbin:/sbin/halt
    mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
    operator:x:11:0:operator:/root:/sbin/nologin
    games:x:12:100:games:/usr/games:/sbin/nologin
    ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
    

    -还可以取中间

    [root@localhost ~]# awk -F: 'NR>=10&&NR<=20{print NR,$0}'  /etc/passwd  
    10 operator:x:11:0:operator:/root:/sbin/nologin
    11 games:x:12:100:games:/usr/games:/sbin/nologin
    12 ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
    13 nobody:x:99:99:Nobody:/:/sbin/nologin
    14 systemd-bus-proxy:x:999:997:systemd Bus Proxy:/:/sbin/nologin
    15 systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin
    16 dbus:x:81:81:System message bus:/:/sbin/nologin
    17 polkitd:x:998:996:User for polkitd:/:/sbin/nologin
    18 tss:x:59:59:Account used by the trousers package to sandbox the tcsd daemon:/dev/null:/sbin/nologin
    19 postfix:x:89:89::/var/spool/postfix:/sbin/nologin
    20 sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
    

    BEGIN/END模式

    • 通常,对于每个输入行,awk 都会执行每个脚本代码块一次。然而,在许多编程情况中
    • 可能需要在awk 开始处理输入文件中的文本之前执行初始化代码。对于这种情况,awk 允许
    • 您定义一个BEGIN 块。我们在前一个示例中使用了BEGIN 块。因为awk 在开始处理输入文件之前会执行BEGIN 块
    • 因此它是初始化 FS(字段分隔符)变量、打印页眉或初始化其它
    • 在程序中以后会引用的全局变量的极佳位置
    • 比如我打表头
    [root@localhost ~]# awk -F: 'BEGIN{print" linenumber     username    userid"}NR>=10&&NR<=20{printf  "%s-12   %+15s %+10d \n " ,NR,$1,$3}'  /etc/passwd
     linenumber     username    userid
    10-12          operator        +11 
     11-12             games        +12 
     12-12               ftp        +14 
     13-12            nobody        +99 
     14-12   systemd-bus-proxy       +999 
     15-12   systemd-network       +192 
     16-12              dbus        +81 
     17-12           polkitd       +998 
     18-12               tss        +59 
     19-12           postfix        +89 
     20-12              sshd        +74 
    

    awk action,循环,数组

    • 常用的action分类
    • Expressions:算术,比较表达式等
    • Control statements:if, while等
    • Compound statements:组合语句
    • input statements
    • output statements:print等

    awk控制语句if-else

    • 语法:if(condition){statement;…}[else statement]:简单语句,如果条件成立就执行语句,如果不成立我就执行else后面的语句
    • if(condition1){statement1}else if(condition2){statement2}:复杂语句,如果条件成立我就执行后面的语句,如果不成立我会检测后面的语句成立不成立,如果还不成立我就执行后面的else后面的语句
    • else{statement3}
    • 使用场景:对awk取得的整行或某个字段做条件判断,if,else可以写多个,和bash不同
    • 示例
    • 第一判断
    [root@localhost ~]# awk -F: '{if($NF=="/bin/bash") print $1}' /etc/passwd
    root
    

    -第二判断

    [root@localhost ~]# awk '{if(NF>5) print $0}' /etc/fstab
    # Created by anaconda on Fri Jul 14 03:57:39 2017
    # Accessible filesystems, by reference, are maintained under '/dev/disk'
    # See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
    /dev/mapper/cl-root     /                       xfs     defaults        0 0
    /dev/mapper/cl-app      /app                    xfs     defaults        0 0
    UUID=c15af5a4-49d5-4551-abda-921540bf8424 /boot                   xfs     defaults        0 0
    /dev/mapper/cl-swap     swap                    swap    defaults        0 0
    
    • 第三判断
    [root@localhost ~]# df -h|awk -F% '/^\/dev/{print $1}'|awk '$NF>=10{print $1,$5}' 
    /dev/sda1 14
    

    awk控制语句

    • while循环
    • 语法:while(condition){statement;…}
    • 条件“真”,进入循环;条件“假”,退出循环
    • 使用场景:
    • 对一行内的多个字段逐一类似处理时使用
    • 对数组中的各元素逐一处理时使用
    • while是处理字段的,要记住哦
    • 行循环AWK自带
    • awk 提供了非常好的类似于 C 语言的if 语句。
    { 
     if ( $1== "foo" ) { 
     if ( $2== "foo" ) { 
     print "uno" 
     } else { 
     print "one" 
     } 
     } elseif ($1== "bar" ) { 
     print "two" 
     } else { 
     print "three" 
     } 
    } 
    
    • 示例一
    [root@localhost ~]# awk '/^[[:space:]]*linux16/{i=1;while(i<=NF) {print $i,length($i); i++}}' /etc/grub2.cfg
    linux16 7
    /vmlinuz-3.10.0-514.el7.x86_64 30
    root=/dev/mapper/cl-root 24
    ro 2
    crashkernel=auto 16
    rd.lvm.lv=cl/root 17
    rd.lvm.lv=cl/swap 17
    rhgb 4
    quiet 5
    LANG=en_US.UTF-8 16
    net.ifnames=0 13
    linux16 7
    /vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
    root=/dev/mapper/cl-root 24
    ro 2
    crashkernel=auto 16
    rd.lvm.lv=cl/root 17
    rd.lvm.lv=cl/swap 17
    rhgb 4
    quiet 5
    
    • 示例二
    [root@localhost ~]# awk '/^[[:space:]]*linux16/{i=1;while(i<=NF) {if(length($i)>=10) {print $i,length($i)}; i++}}' /etc/grub2.cfg
    /vmlinuz-3.10.0-514.el7.x86_64 30
    root=/dev/mapper/cl-root 24
    crashkernel=auto 16
    rd.lvm.lv=cl/root 17
    rd.lvm.lv=cl/swap 17
    LANG=en_US.UTF-8 16
    net.ifnames=0 13
    /vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
    root=/dev/mapper/cl-root 24
    crashkernel=auto 16
    rd.lvm.lv=cl/root 17
    rd.lvm.lv=cl/swap 17
    
    • do-while循环
    • 语法:do {statement;…}while(condition
    • 意义:无论真假,至少执行一次循环体
    • 示例
    [root@localhost ~]#  awk 'BEGIN{ total=0;i=0;do{ total+=i;i++;}while(i<=100);print total}'
    5050
    

    for循环

    • for循环
    • 语法:for(expr1;expr2;expr3) {statement
    • 常见用法:
    • for(variable assignment;condition;iteration
    • {for-body}
    • 特殊用法:能够遍历数组中的元素
    • 语法:for(var in array) {for-body}
    • 示例
    [root@localhost ~]# awk '/^[[:space:]]*linux16/{for(i=1;i<=NF;i++) {print $i,length($i)}}' /etc/grub2.cfg
    linux16 7
    /vmlinuz-3.10.0-514.el7.x86_64 30
    root=/dev/mapper/cl-root 24
    ro 2
    crashkernel=auto 16
    rd.lvm.lv=cl/root 17
    rd.lvm.lv=cl/swap 17
    rhgb 4
    quiet 5
    LANG=en_US.UTF-8 16
    net.ifnames=0 13
    linux16 7
    /vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
    root=/dev/mapper/cl-root 24
    ro 2
    crashkernel=auto 16
    rd.lvm.lv=cl/root 17
    rd.lvm.lv=cl/swap 17
    rhgb 4
    quiet 5
    

    其他语句

    • switch语句
    • 语法:switch(expression) {case VALUE1 or /REGEXP/:
    • statement1; case VALUE2 or /REGEXP2/: statement2;
    • break和continue
    • awk ‘BEGIN{sum=0;for(i=1;i<=100;i++)
    • {if(i%2==0)continue;sum+=i}print sum}‘
    • awk ‘BEGIN{sum=0;for(i=1;i<=100;i++)
    • {if(i==66)break;sum+=i}print sum}‘
    • 示例
    [root@localhost ~]# awk -F: '{if($3%2!=0) next; print $1,$3}' /etc/passwd
    root 0
    daemon 2
    lp 4
    shutdown 6
    mail 8
    games 12
    ftp 14
    systemd-network 192
    polkitd 998
    libstoragemgmt 996
    rpc 32
    rtkit 172
    geoclue 994
    gdm 42
    nfsnobody 65534
    ntp 38
    sshd 74
    tcpdump 72
    mageedu 1000
    

    AWK数组

    • 关联数组:array[index-expression]
    • index-expression:
    • 可使用任意字符串;字符串要使用双引号括起来
    • 如果某数组元素事先不存在,在引用时,awk会自动创建此元素,并将其值初始化为“空串”
    • 若要判断数组中是否存在某元素,要使用“index in array”格式进行遍历
    • 示例一
    • 数组非常绕好好看
    [root@localhost ~]# awk 'BEGIN{weekdays["mon"]="Monday";weekdays["tue"]="Tuesday";print weekdays["mon"]}'
    Monday
    

    相关文章

      网友评论

        本文标题:Linux基础之三剑客AWK进阶

        本文链接:https://www.haomeiwen.com/subject/dgefkxtx.html