美文网首页
2019-01-24 日志使用rg,sed,awk提取过滤出支付

2019-01-24 日志使用rg,sed,awk提取过滤出支付

作者: 五大RobertWu伍洋 | 来源:发表于2019-07-19 20:53 被阅读0次

从日志过滤出关注的行:

 2038  tail -10000 alipay.log_2019-01-24-am1106 |rg "<input>|<outstr>"
 2039  rg "<input>|<outstr>" alipay.log_2019-01-24-am1106 > rg-alipay-in-out.txt
 2040  ll -lht rg-alipay-in-out.txt
 2041  wc -l rg-alipay-in-out.txt
 2042  head rg-alipay-in-out.txt
 2043  tail rg-alipay-in-out.txt

过滤不想要的模式只留下关心的内容——返回结果存在手机号的:

#error
 2044  rg -v "<input>|<outstr>[]</outstr>" rg-alipay-in-out.txt  > rg-alipay-in-out.txt-out-notempty

#ok
 2045  rg -v "<input>|<outstr>\[\]</outstr>" rg-alipay-in-out.txt  > rg-alipay-in-out.txt-out-notempty
 2046  wc -l rg-alipay-in-out.txt-out-notempty
 2047  tail rg-alipay-in-out.txt-out-notempty

删除xml标签只留下内容:

#error
 2048  sed -i -e 's#<outstr>[##' -e 's#]</outstr>##' rg-alipay-in-out.txt-out-notempty
 2049  wc -l rg-alipay-in-out.txt-out-notempty
 2050  tail rg-alipay-in-out.txt-out-notempty
 2051  head rg-alipay-in-out.txt-out-notempty

#ok
 2052  sed -i -e 's#<outstr>\[##' -e 's#\]</outstr>##' rg-alipay-in-out.txt-out-notempty
 2053  head rg-alipay-in-out.txt-out-notempty
 2054  tail rg-alipay-in-out.txt-out-notempty
 2055  wc -l rg-alipay-in-out.txt-out-notempty

将逗号转换为换行符,每个手机号一行

 2056  sed -i 's/,/\n/g' rg-alipay-in-out.txt-out-notempty
 2057  wc -l rg-alipay-in-out.txt-out-notempty

排序并去重

 2058  sort rg-alipay-in-out.txt-out-notempty|uniq > rg-alipay-in-out.txt-out-notempty-uniq

手机号长度要大于10:

 2062  echo "abc" |wc -L
 2063  echo "abc" ||awk '{print length($0)}'
 2064  echo "abc" |awk '{print length($0)}'
 2065  awk 'length($0)>10' rg-alipay-in-out.txt-out-notempty-uniq > rg-alipay-in-out.txt-out-notempty-uniq-length

另:获取input的内容:

 2072  rg "<input>" rg-alipay-in-out.txt > rg-alipay-in-out.txt-in
 2073  wc -l rg-alipay-in-out.txt-in
 2074  head rg-alipay-in-out.txt-in
 2075  sed -i -e 's#<input>\[##' -e 's#\]</input>##' rg-alipay-in-out.txt-in
 2076  wc -l rg-alipay-in-out.txt-in
 2077  sed -i -e 's#<input>##' rg-alipay-in-out.txt-in

相关文章

  • 2019-01-24 日志使用rg,sed,awk提取过滤出支付

    从日志过滤出关注的行: 过滤不想要的模式只留下关心的内容——返回结果存在手机号的: 删除xml标签只留下内容: 将...

  • Shell 脚本绘图实例使用gnuplot

    日志的格式: 日志的搜索用到了grep 命令, 提取文本列用到了 awk 命令,文本替换 sed命令,cut 也可...

  • shell 数据扣取

    从sql中提取某一列。 方法:awk:awk -F ',' '{print $1}' aaa>aa sed 's...

  • shell字符串截取

    cut 命令 grep 在文件中提取行,cut awk sed 提取列 cut [选项] 文件名 -f 提取第几列...

  • linux 命令 awk

    awk使用 sed -n '/queryAll2/p' 2017-02-20.log | awk -F ',' '...

  • 4 种方法去除文本中的空行

    sed grep tr awk 测试文件如下: sed grep awk tr

  • 什么是ELK?

    为什么做日志系统 通常当系统发生故障时,工程师需要登录到各个服务器上,使用 grep / sed / awk 等 ...

  • awk、sed使用

    1 比较两个文件 NR:表示awk开始执行程序后所读取的数据行数。(ALL)FNR:awk当前读取的记录数,其变量...

  • awk和sed指令入门

    sed偏向于编译文档,awk偏向与分析文本 sed使用方式 增加 sed -i "2a line 3 " test...

  • 三剑客练习

    过滤出一个文件的第二行,第三行 解决;1.sed -n '2,3p' oldboy 2. awk 'NR...

网友评论

      本文标题:2019-01-24 日志使用rg,sed,awk提取过滤出支付

      本文链接:https://www.haomeiwen.com/subject/dloyjqtx.html