假如这个文本里面的第三列是个时间戳,我想要知道同一个时间内处理了多少条记录,那么使用awk,这样即可。
cat logfile | awk '{a[$3]++}END{for(i in a){print i,a[i] | "sort -k 1"}}'
在这条命令中,将文本的第三列作为key,同样的key不停累加,最后输出累加的数组值。最后sort -k1是将结果按照第一列来排序,就是时间戳的小时来排序。
还有一种更为简便的方法,使用linux的uniq -c命令来统计,不用写awk命令:
cat logfile | awk '{print $3}' | uniq -c\
网友评论