美文网首页
实用awk一行流01_2021-06-16

实用awk一行流01_2021-06-16

作者: 知无牙 | 来源:发表于2021-06-16 13:17 被阅读0次

废话没有,直接上实用代码,当你着急忙慌的时候,希望它能帮到你

测试数据:WorldCupGroup.data(9行X6列)

cat WorldCupGroup.data

分组第一档第二档第三档第四档第五档

A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

1.首先我们来获取文件的总行数(方法有很多,当然你也可以使用wc -l WorldCupGroup.data;也可以实用less -SN WorldCupGroup.data,输入G,查看行数;更可以使用vim编辑器打开然后输入:set nu,接着输入G跳到最后一行,来查看行数),但是我们用awk实现就是下面的代码:

awk 'END{print FILENAME"的行数为:"NR}' WorldCupGroup.data

WorldCupGroup.data的行数为:9

2.接着我们打印第5行内容(方法也有很多,可以用sed)

awk 'NR==5' WorldCupGroup.data

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

当然如果你知道第五行有关键而且特殊的词,例如‘D组’

awk '/D组/ {print $0}' WorldCupGroup.data或者

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

awk '$1~/D组/ {print $0}' WorldCupGroup.data

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

3.我们接着打印每个输入行的最后一个字段

awk '{ print $NF }' WorldCupGroup.data

第五档

关岛*

尼泊尔

柬埔寨*

新加坡

孟加拉国*

蒙古*

印度尼西亚

斯里兰卡*

4.然后,我们打印打印最后一行的最后一个字段

awk '{ field = $NF } END { print field }' WorldCupGroup.data

斯里兰卡*

5.打印字段数小于等于6的行

awk 'NF<=6' WorldCupGroup.data

分组第一档第二档第三档第四档第五档

A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

6.打印最后一个字段数大于等于3的行

awk '$NF >=3' WorldCupGroup.data

分组第一档第二档第三档第四档第五档

A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

7.统计所有输入行的字段数总和

awk '{ nf = nf + NF } END { print nf }' WorldCupGroup.data

54

8.打印包含‘组’的所有行数

awk '/组/ { nlines = nlines + 1 } END { print nlines }' WorldCupGroup.data

9

9.打印具有最大值的第一个字段, 以及包含它的行(字符串也是可以比较大小的,根据ASCII编码的前后顺序,具体见ASCII码 - 基本ASCII码和扩展ASCII码,最全的ASCII码对照表 (asciim.cn)

awk '$1 > max { max = $1; maxline = $0 } ⏎

END { print max, maxline }' WorldCupGroup.data

分组分组第一档第二档第三档第四档第五档

10.打印字段数不为0的行

awk 'NF != 0' WorldCupGroup.data

分组第一档第二档第三档第四档第五档

A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

11.打印长度超过 60 个字符的行

awk 'length($0) > 60' WorldCupGroup.data

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

12.获取每行的字符数

awk '{nch=length($0);print nch"\t"$0}' WorldCupGroup.data | column -t

56 分组 第一档 第二档 第三档 第四档 第五档

52 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

57 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

52 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

69 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

52 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

61 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

58 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

52 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

13.在每一行的前面加上它的字段数

awk '{ print NF, $0 }' WorldCupGroup.data

6 分组 第一档 第二档 第三档 第四档 第五档

6 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

6 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

6 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

6 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

6 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

6 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

6 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

6 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

14. 在每一行的前面加上行数、字段数、字符数

awk '{ nch=length($0);print NR"\t"NF"\t"nch"\t"$0 }' WorldCupGroup.data

1 6 56 分组 第一档 第二档 第三档 第四档 第五档

2 6 52 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

3 6 57 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

4 6 52 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

5 6 69 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

6 6 52 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

7 6 61 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

8 6 58 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

9 6 52 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

15.打印每一行的第 1 与第 2 个字段, 但顺序相反

awk '{ print $2"\t"$1 }' WorldCupGroup.data

第一档分组

中国A组

澳大利亚B组

伊朗C组

沙特阿拉伯D组

卡塔尔E组

日本F组

阿联酋G组

韩国H组

16.我们继续交换每一行的第 1 与第 2 个字段, 并打印该行

awk '{ temp = $1; $1 = $2; $2 = temp; print }' WorldCupGroup.data | column -t

第一档分组第二档第三档第四档第五档

中国A组 叙利亚 菲律宾 马尔代夫 关岛*

澳大利亚B组 约旦 台湾地区 科威特 尼泊尔

伊朗C组 伊拉克 巴林 中国香港 柬埔寨*

沙特阿拉伯D组 乌兹别克斯坦 巴勒斯坦 也门 新加坡

卡塔尔E组 阿曼 印度 阿富汗 孟加拉国*

日本F组 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

阿联酋G组 越南 泰国 马来西亚* 印度尼西亚

韩国H组 黎巴嫩 朝鲜 土库曼 斯里兰卡*

17.将每一行的第一个字段用行号代替

awk '{ $1=NR; print }' WorldCupGroup.data | column -t

1 第一档 第二档 第三档 第四档 第五档

2 中国 叙利亚 菲律宾 马尔代夫 关岛*

3 澳大利亚 约旦 台湾地区 科威特 尼泊尔

4 伊朗 伊拉克 巴林 中国香港 柬埔寨*

5 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

6 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

7 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

8 阿联酋 越南 泰国 马来西亚* 印度尼西亚

9 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

18.打印删除了第 6个字段后的行

awk '{ $2 = ""; print }' WorldCupGroup.data | column -t

分组第二档第三档第四档第五档

A组 叙利亚 菲律宾 马尔代夫 关岛*

B组 约旦 台湾地区 科威特 尼泊尔

C组 伊拉克 巴林 中国香港 柬埔寨*

D组 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 阿曼 印度 阿富汗 孟加拉国*

F组 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 越南 泰国 马来西亚* 印度尼西亚

H组 黎巴嫩 朝鲜 土库曼 斯里兰卡*

19.将每一行的字段按逆序打印

awk '{ for (i = NF; i > 0; i = i - 1) printf("%s ", $i);printf("\n") }' WorldCupGroup.data | column -t

第五档第四档第三档第二档第一档分组

关岛* 马尔代夫 菲律宾 叙利亚 中国 A组

尼泊尔科威特台湾地区约旦澳大利亚B组

柬埔寨* 中国香港 巴林 伊拉克 伊朗 C组

新加坡也门巴勒斯坦乌兹别克斯坦沙特阿拉伯D组

孟加拉国* 阿富汗 印度 阿曼 卡塔尔 E组

蒙古* 缅甸 塔吉克斯坦 吉尔吉斯斯坦 日本 F组

印度尼西亚马来西亚* 泰国 越南 阿联酋 G组

斯里兰卡* 土库曼 朝鲜 黎巴嫩 韩国 H组

相关文章

  • 实用awk一行流01_2021-06-16

    废话没有,直接上实用代码,当你着急忙慌的时候,希望它能帮到你 测试数据:WorldCupGroup.data(9行...

  • 【现学现忘&Shell编程】— 34.AWK编程之awk内置变量

    1、awk内置变量 awk内置变量作用$0代表目前awk所读入的整行数据。我们已知awk是一行一行读入数据的,$0...

  • awk

    awk 工具 awk也是流式编辑器,针对文档中的行来操作,一行一行地执行。awk兼具sed的所有功能,而且更加强大...

  • linux 命令awk & print

    awk处理过程: 依次对每一行进行处理,然后输出awk命令形式:awk [-F|-f|-v] ‘BEGIN{} /...

  • shell awk 命令

    awk的最基本功能是在文件或者字符串抽取信息。通常awk是以文件的一行为处理单位的。awk每接收文件的一行,然后执...

  • 2018-10-14

    Linux常用命令之sed awk(关键字:分析&处理)一行一行的分析处理 awk '条件类型1{动作1}条件类型...

  • 【awk】awk之RS、ORS与FS、OFS

    awk next 将多行合并成一行显示 http://www.361way.com/awk-next-merge-...

  • linux命令学习(三)——awk

    学习资料:《linux大棚命令百篇上》 awk介绍及简单实用 以下是在网上找到的两个awk的介绍: awk是一种处...

  • shell对输出流的处理

    shell对输出流的处理awk介绍awk基本用法awk高级用法awk小技巧在日常计算机管理中,总会有很多数据输出到...

  • linux awk

    一. AWK 说明 awk的处理文本和数据的方式:它逐行扫描文件,从第一行到最后一行,寻找匹配的特定模式的行,并...

网友评论

      本文标题:实用awk一行流01_2021-06-16

      本文链接:https://www.haomeiwen.com/subject/bpixyltx.html