美文网首页
awk脚本编程实例讲解(判断,循环,数组)

awk脚本编程实例讲解(判断,循环,数组)

作者: 果子学长 | 来源:发表于2020-02-24 23:44 被阅读0次

    1.条件判断

    if语句格式:{if(表达式) {语句;语句;...}}

    统计系统用户数

    0-10001系统用户,大于1000普通用户

    #awk -F: '{if($3>0 && $3<1000){count++;}} END{print count}' /etc/passwd

    记住:awk是逐行处理。所以对每一行进行判断处理后进行加1操作。

    打印普通用户

    [root@bigdata3 dan_test]# awk -F : '{if($3 >1000){print $1}}' /etc/passwd

    统计普通用户数

    [root@bigdata3 dan_test]# awk -F : '{if($3 >1000){ i++}} END{print i}' /etc/passwd

    if ...else 语句格式:{if(表达式) {语句;语句;...} else{语句;语句;...}}

    #awk -F:'{if ($3 == 0){print $1} else {print $7}}' /etc/passwd

    #awk -F:'{if ($3 == 0){count++} else {i++}}' /etc/passwd

    #awk -F:'{if ($3 == 0){count++} else {i++}} END{print "管理员个数:"count;print"系统用户数:"i }' /etc/passwd

    统计普通用户个数,系统用户个数,管理员的个数

    [root@bigdata3 dan_test]# awk -F : '{if($3==0){i++} else if($3>0 && $3<100){j++} else if($3>1000){k++}} END{print "管理员用户数:"i;print"系统用户数:"j;print"普通用户数"k}' /etc/passwd


    2.循环

    2.1 for循环C风格for

    [root@bigdata3 dan_test]# awk 'BEGIN{for(i=1;i<5;i++){print i}}'

    [root@bigdata3 dan_test]# awk -F: '{for(i=1;i<=5;i++){print $0}}' awk.txt

    cat awk.txt

    dandan:dandan1

    [root@bigdata3 dan_test]# awk -F: '{for(i=1;i<=NF;i++){print $i}}' awk.txt

    NF:表示列的个数

    2.2 whiel循环

    cat password

    [root@bigdata3 dan_test]# awk -F : '/^root/{i=1;while(i<8){print $i;i++}}' password

    [root@bigdata3 dan_test]# awk -F : '{i=1;while(i<NF){print $i;i++}}' password

    解释:是针对每一行,循环该行按照:切割后的次数,并将该字段打印出来。

    主要理解点:针对每一行进行循环,理解的时候注意对awk的工作原理的理解

    [root@bigdata3 dan_test]# awk -F : '{i=1;while(i<10){print $0;i++}}' password

    表示将每行打印10次

    cat b.txt

    [root@bigdata3 dan_test]# awk '{i=1;while(i<=NF){print $i;i++}}' b.txt

    实际上是对每行的内容进行遍历

    awk默认分割是对空行的分割

    (1)对每一行进行循环,第一行循环2次,分别打印每个字段

    (2)第二行循环3次,分别打印每个字段

    (3)第三行循环4次,分别打印每个字段

    因此实际上是对每行内容的遍历

    3. awk数组

    数组:存储一系列相同类型的元素,健/值方式存储,通过下标(健)来访问值。awk中数组称为关联数组,不仅可以使用数字作为下标,还可以使用字符串作为下标。数组元素的键和值存储在 awk 程序内部的一个表中,该表采用散列算法,因此数组元素是随机排

    序。

    数组格式:array[index]=value

    数据准备:

    [root@bigdata3 dan_test]# tail -n5 /etc/passwd

    [root@bigdata3 dan_test]# tail -n5 /etc/passwd | awk -F: '{username[++i]=$1} END{print username[i]}'

    分析:该数组定义是将每行的第一个字段赋值给数组username,此时i没操作一次进行加一,到最后打印的是行处理结束时所赋值的字段,由于只有5行,所以打印username[5] flume。END是行处理完了才执行。

    注意:++i数组的下标是先从1开始,i++数组的下标是先从0开始。

    那么如果想打印数组中每个元素呢?此时需要for循环在END语句中进行遍历

    [root@bigdata3 dan_test]# tail -n5 /etc/passwd | awk -F: '{username[++i]=$1} END{for (i in username){print username[i],i}}'

    下标从i++开始注意变化:

    [root@bigdata3 dan_test]# tail -n5 /etc/passwd | awk -F: '{username[i++]=$1} END{for (i in username){print username[i],i}}'

    统计/etc/passwd下各类型shell的数量

    cat /etc/shell

    [root@bigdata3 dan_test]# awk -F: '{shells[$NF]++} END{for(i in shells){print i,shells[i]}}' /etc/passwd

    知识点准备:

    (1)数组默认初始值是0

    (2)a[i]++表示对数组元素值自加

    (3)shells[$NF]:表示把每行的最后一个字段作为索引,同时其值自加

    推理过程:

    shell[/bin/bash]:当读取第一行数据时候遇到/bin/bash此时其数组对应的值加一,数组值为1

    当读取第二行数据遇到/sbin/nologin,此时shell[/sbin/nologin]其对应的数组值加一,数组值为1

    当读取第三行数据时,遇到/bin/bash,数组值shell[/bin/bash]加一,此时对应值为2

    当读取第四行数据时,遇到/sbin/nologin,此时shell[/sbin/nologin]其对应的数组值加一,数组值为2

    ......

    依次类推

    最终直到所有的行被读完,数组中保存的累计值就为该字符串索引出现的次数

    推理时候一定要联想读取数据是一行一行处理和一般数组区别开来。

    遍历最终结果的时候,类似于数学中的反函数,可以把字符串作为索引的这类数组问题理解为反函数。这样给字符串统计带来了方便,即awk中shell[字符串]++这样的数组用来统计某个文件中字符串出现的次数。也就是你想统计谁,让谁作为索引然后循环遍历就可以了。

    统计 TCP 连接状态

    [root@bigdata3 dan_test]# netstat -antp |awk '/^tcp/{a[$6]++}END{for(v in a)print a[v],v}'

    打印/etc/services出现次数大于等于 2 的

    [root@bigdata3 dan_test]# tail /etc/services |awk '{a[$1]++}END{for(v in a) if(a[v]>=2){print a[v],v}}'

    相关文章

      网友评论

          本文标题:awk脚本编程实例讲解(判断,循环,数组)

          本文链接:https://www.haomeiwen.com/subject/qcyrqhtx.html