美文网首页
linux下awk内置函数的使用(split/substr/le

linux下awk内置函数的使用(split/substr/le

作者: 大地瓜_ | 来源:发表于2018-11-05 15:49 被阅读0次

一、split函数

awk的内建函数split允许你把一个字符串分隔为单词并存储在数组中。你可以自己定义域分隔符或者使用现在FS(域分隔符)的值。

split (string, array, field separator)
split (string, array)  -->如果第三个参数没有提供,awk就默认使用当前FS值。

在Hadoop中取出最近七天的文件代码

数据.png

上图表示很多天的数据,获取七天的数据的Hdfs路径

hdfs -ls /app/ps/rank/police/spam_mining/worldtree_spaminfo/  | 
    awk '{
    cnt = split($NF, arr, "/");  
    print cnt ;
    if(match(arr[cnt], /^[0-9]+$/))
    {
       print arr[cnt]
    }
 }' |  tail -7 | 
awk '{
         print "-input '${HDFS_PATH}'"$1" " 
   }';

解释说明

NF 表示当前行的字段数量
$NF表示最后一个字段

cnt = split($NF, arr, "/" ) 表示输出在arr数组内,用 / 分割; 返回值为数组的长度
match(arr[cnt], /^[0-9]+$/) 检查正则表达式是否能够匹配
在正则中用 / / 中间部分包含正则表达式
^[0-9]+$ 表示以数字开头和结尾的字符串

相关文章

  • linux下awk内置函数的使用(split/substr/le

    一、split函数 awk的内建函数split允许你把一个字符串分隔为单词并存储在数组中。你可以自己定义域分隔符或...

  • Linux之awk内置函数的使用

    awk为程序员们提供了非常丰富的内置函数,现在这里分享下我所了解和用过的awk内置函数算数函数 :[ 3个 ] r...

  • js截取函数对比

    截取函数有:split()、slice()、substr()、substring()、charAt()、charC...

  • Python 文件读写

    或者 或者使用Python内置函数 .strip() 和 .split()函数,进行分割比如:由于在python...

  • awk的介绍和使用

    1 awk的介绍 2 awk 的变量 需要使用 -v 指定 3 控制语句 4 数组 5 内置函数

  • php chunk_split函数怎么用?

    chunk_split()函数在PHP中的一个内置函数,语法为string chunk_split($string...

  • awk内置函数

    这节详细介绍awk内置函数,主要分以下3种类似:算数函数、字符串函数、其它一般函数、时间函数 一、算术函数: 以下...

  • PHP截取中文字符串

    原生写法 php内置函数 string mb_substr ( string $str , int $start ...

  • js中substr()、substring()、slice()、

    substr() substring() slice() splice() split()

  • 代码

    一、三个split Python内置的split()split() 函数通过指定分隔符对字符串进行切片,如果参数 ...

网友评论

      本文标题:linux下awk内置函数的使用(split/substr/le

      本文链接:https://www.haomeiwen.com/subject/tpesxqtx.html