利用shell显示wordcount功能

作者: 山阴少年 | 来源:发表于2018-03-26 11:43 被阅读17次

Shell脚本编程是Linux系统最为核心的技术之一，它能够利用简单的命令来实现一些复杂的功能，同时，由于Linux提供了很多文本处理命令，如grep(grep family), tr, sed, awk等，一旦熟练掌握这些命令，那么你在Linux系统中处理文本就会得心应手。
本文将展示如何利用Shell来实现WordCount功能。
首先先看wordcount.sh的代码，用来实现WordCount功能。

#!/bin/bash

# filename: wordcount.sh
# usage: word count

# handle position arguments
if [ $# -ne 1 ]
then
    echo "Usage: $0 filename"
    exit -1
fi

# realize word count
printf "%-14s%s\n" "Word" "Count"

cat $1 | tr 'A-Z' 'a-z' | \
egrep -o "\b[[:alpha:]]+\b" | \
awk '{ count[$0]++ }
END{
for(ind in count)
{ printf("%-14s%d\n",ind,count[ind]); }
}' | sort -k2 -n -r

在上述代码中，$1参数为你输入的文本，利用cat命令读取其内容，利用tr命令将所有的大写字母转换为小写字母，再利用egrep命令抓取文本中的所有单词，并逐项输出，最后利用awk命令和关联数组来实现word count功能，并按照出现的数量递减输出。
接着就是测试啦~~
首先是road.txt文件，里面是美国诗人 Robert Frost写的诗歌 The Road Not Taken，参考网址为：https://www.poets.org/poetsorg/poem/road-not-taken。统计该文本的每个单词出现的数量，可以运行命令

./wordcount.sh road.txt

运行结果如下：

这里只显示了前面几个单词的出现数量。
再测试一个文本speech.txt，里面的内容是罗斯福总统二战期间对日本宣战的演讲，具体网址为： http://www.historyplace.com/speeches/fdr-infamy.htm .运行命令

./wordcount.sh speech.txt

运行结果如下：

这里只显示了前面几个单词的出现数量。
本次程序编写主要参考《Linux脚本攻略》。
本次分享到此结束，欢迎大家交流~~

网友评论

cf6d95617c55:多多交流，小白一个。哈哈
IT人故事会:楼主的心血啊！谢谢博主

本文标题：利用shell显示wordcount功能

本文链接：https://www.haomeiwen.com/subject/dezlcftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

利用shell显示wordcount功能

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Shell

我用 Linux

Linux

Linux学习之路