美文网首页shell
【现学现忘&Shell编程】— 33.AWK编程之awk的条件

【现学现忘&Shell编程】— 33.AWK编程之awk的条件

作者: 繁华似锦Fighting | 来源:发表于2020-10-21 08:32 被阅读0次

    1、awk的条件

    2、说明

    以下练习使用如下文本

    ID      Name    Python  Linux   MySQL   Java
    1       Tangs   88      87      86      85.55   
    2       Sunwk   99      98      97      96,66   
    3       Zhubj   77      76      75      74.44   
    4       Shahs   66      65      64      63.33 
    

    (1)BEGIN

    BEGIN是awk的保留字,是一种特殊的条件类型。

    BEGIN的执行时机是在awk程序一开始时,尚未读取任何数据之前执行。

    BEGIN后的动作只执行一次,因为当awk开始从文件中读入数据,BEGIN的条件就不再成立,所以BEGIN定义的动作只能被执行一次。

    练习:执行命令查看BEGIN作用:

    awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt

    [root@localhost tmp]# awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt 
    This is BEGIN action
    Name    Python  Java    
    Tangs   88      85.55   
    Sunwk   99      96.66   
    Zhubj   77      74.44   
    Shahs   66      63.33   
    

    说明:

    • awk命令只要检测不到完整的单引号不会执行,所以这个命令的换行不用加入\,就是一行命令

    • 上边命令定义了两个动作

      第一个动作使用BEGIN条件,所以会在读入文件数据前打印“This is BEGIN action”(只会执行一次)。

      第二个动作会打印文件中的对应文本。

    (2)END

    END也是awk保留字,不过刚好和BEGIN相反。

    END是在awk程序处理完所有数据,即将结束时执行。END后的动作只在程序结束时执行一次。

    练习:执行命令查看END作用:

    awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt

    [root@localhost tmp]# awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt 
    Name    Python  Java    
    Tangs   88      85.55   
    Sunwk   99      96.66   
    Zhubj   77      74.44   
    Shahs   66      63.33   
    This is END action
    
    

    说明:在输出结尾输入“This is END action”,这并不是文档本身的内容,而且只会执行一次。

    (3)关系运算符

    假设我想看看Java绩大于等于80分的学员是谁,就可以这样输入命令:

    grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'

    # 判断第六字段(Java成绩)大于等于80分的行,如果判断式成立,则打印第2列(学员名)
    [root@localhost tmp]# grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
    Tangs
    Sunwk
    

    grep -v "Name" student.txt是把标题过滤掉。

    (4)说明awk中条件表达式的执行过程

    要先说明一下,虽然awk是列提取命令,但是也要按行来读入的。

    在awk处理一个文本文件的时候:

    • 先判断表达式中有没有BEGIN。

      如果有,就先执行BEGIN定义的操作,且执行一次。

    • 如果没有BEGIN或者BEGIN定义的动作执行完成之后,会把文本中的第一行数据读入awk中,

      把该行的整行数据赋予$0变量中,

      把该行数据的第一列赋值在$1变量中,第二列赋值在$2变量中,以此类推。

    • 例如awk '{printf $2 "\n"}' student.txt,意思是打印文本中的第二列姓名。

      我们先忽略掉条件,流程是:

      awk读取第一行数据(上面一步),然后执行动作输出第二列信息,也就是输出第一行的第二列信息。

      然后开始读取第二行数据,然后再执行动作,输出第二行的第二列信息,

      然后再读取第三行数据,之后执行动作,输出第三行的第二列信息,

      以此类推,基本上就是这样的一个过程。

    • 然后在加上条件awk '$6>=80 {printf $2 "\n"}' student.txt

      判断第六列Java的成绩大于80分,才输出。

      还是和上边一样,先是awk读取第一行数据完成之后,就要处理动作了,

      但是在处理动作之前,先要判断一下动作前面的条件是否成立,

      如果成立,则执行后边的动作。

      如果不成立,则不执行跟在后边的动作。

      然后在开始读取第二行数据,重复上边的流程,以此类推。

      总结一下就是:加入了条件之后,只有条件成立动作才会执行,如果条件不满足,则动作则不运行。

    • 最后如果有END,则把END中定义的动作执行一次。

    以上就是awk的执行流程。

    (5)awk中使用正则表达式

    如果要想让awk识别字符串,必须使用//包含,//中识别的就是正则表达式规则匹配的字符串。

    例如:

    # 输出打印Sunwk的成绩
    # awk会匹配有Sunwk符号的行,并输出
    [root@localhost tmp]# awk '/Sunwk/ {print}' student.txt 
    2   Sunwk   99  98  97  96.66
    

    注意:这里要注意在awk中,使用//包含的字符串,awk命令才会查找。也就是说字符串必须用//包含,awk命令才能正确识别。

    (6)A~B练习

    A~B是A包含B的意思。

    练习:查看Sunwk用户的Java成绩。

    # 匹配第二字段中包含有“Sun”字符,则打印第六字段数据
    [root@localhost tmp]# awk '$2 ~ /Sun/ {printf $6 "\n" }' student.txt 
    96.66
    

    提示:(6)练习的方式,是在某一列中查找是否包含一个字符串。而上面(5)的写法,是在一行数据当中匹配是否包含一个字符串,根据需求灵活使用。

    注意:~两边有无空格都可以。

    拓展练习:

    当使用df命令查看分区使用情况时,如果我只想查看真正的系统分区的使用状况,而不想查看光盘和临时分区的使用状况,则可以执行如下:

    # 查询包含有sda+数字的行,并打印第一字段和第五字段
    [root@localhost tmp]# df -h | awk '/sda[0-9]/ {printf $1 "\t" $5 "\t" "\n"}'
    /dev/sda3   12% 
    /dev/sda1   15% 
    

    相关文章

      网友评论

        本文标题:【现学现忘&Shell编程】— 33.AWK编程之awk的条件

        本文链接:https://www.haomeiwen.com/subject/puslmktx.html