grep 命令详解

作者: tyrone_li | 来源:发表于2016-08-18 22:42 被阅读1064次

    1. 简介

    grep: Gloabal Search Regular Expression and Print out the line,意为全局搜索正则表达式并打印文本行。所以

    • grep是一个强大的文本搜索工具
    • grep与正则表达式联系紧密

    之后也会从这两个大的方面来详细介绍。grep命令的基本语法如下:

    grep [options] pattern [file...]
    

    [options]表示选项,具体的命令选项见下表。pattern表示要匹配的模式(包括目标字符串、变量或者正则表达式),file表示要查询的文件名,可以是一个或者多个。pattern后面所有的字符串参数都会被理解为文件名。

    选项 说明
    -c       只打印匹配的文本行的行数,不显示匹配的内容
    -i 匹配时忽略字母的大小写
    -h 当搜索多个文件时,不显示匹配文件名前缀
    -n 列出所有的匹配的文本行,并显示行号
    -l 只列出含有匹配的文本行的文件的文件名,而不显示具体的匹配内容
    -s 不显示关于不存在或者无法读取文件的错误信息
    -v 只显示不匹配的文本行
    -w 匹配整个单词
    -x 匹配整个文本行
    -r 递归搜索,搜索当前目录和子目录
    -q 禁止输出任何匹配结果,而是以退出码的形式表示搜索是否成功,其中0表示找到了匹配的文本行
    -b 打印匹配的文本行到文件头的偏移量,以字节为单位
    -E 支持扩展正则表达式
    -P 支持Perl正则表达式
    -F 不支持正则表达式,将模式按照字面意思匹配

    二、grep简单应用场景

    首先介绍一下我的实验环境,在/home/tyrone下建立3个简单的txt文件:

    #----------------------/home/tyrone/text1.txt---------------------
    hello world
    mailx
    uuen
    letitia
    #----------------------/home/tyrone/text2.txt---------------------
    hello world,this is for grep test 
    #----------------------/home/tyrone/text3.txt---------------------
    hello world
    tyrone
    

    (1)多文件查询,file之间用空格隔开

    grep -i "hello world" test1.txt test2.txt
    
    #输出结果
    test1.txt:hello world
    test2.txt:hello world,this is for grep test 
    

    (2)多模式匹配,模式之间为“逻辑或”的关系,匹配任意一个

    #方法1:使用-e选项
    grep -e "hello world" -e "mailx" -r /home/tyrone
    
    #方法2:使用正则表达式,-E
    grep -E "hello world|mailx" -r /home/tyrone
    
    #方法3:使用正则表达式,egrep,同grep -E等效
    egrep "hello world|mailx" -r /home/tyrone
    
    #输出结果均相同:
    /home/tyrone/test1.txt:hello world
    /home/tyrone/test1.txt:mailx
    /home/tyrone/test2.txt:hello world,this is for grep test
    /home/tyrone/test3.txt:hello world
    

    (3)多模式匹配,模式之间为“逻辑与”的关系,匹配所有模式。

    这个问题我查阅了很多方法,并逐一试验了一下。基本思想大致相同:先匹配一个模式,然后grep下面一个模式,将前一次grep的结果作为要查询文件路径依次向后传递。

    注意:前一次grep的结果必须加上-l选项,否则会把匹配成功的文件内容作为要查询的文件名向后传递

    我希望做到的是能够显示出同时包含模式的文件,并且跟随显示匹配每个模式的内容。可惜我现在找到的方法都仅仅能够显示匹配最后一个模式的内容。

    #方法1:比较笨,将其按一次的结果重定向到一个文件,然后xargs grep来依次读取。
    grep -i "hello world" -rl /home/tyrone >> reslut.txt
    cat result.txt | xargs grep -i "mailx" 
    
    #输出结果
    /home/tyrone/test1.txt:mailx
    
    #方法2:直接利用管道
    grep -i "hello world" -rl /home/tyrone | xargs grep -i "mailx"
    
    #输出结果
    /home/tyrone/test1.txt:mailx
    
    #方法3:使用find,适合于需要灵活判断条件的场景。例如查找指定路径下,同时匹配多个模式的txt文件。
    #注意:本例中“mailx”后面的命令必须加上反引号 ` ,否则会被当作要查询的文件名。
    grep -i "mailx" `find /home/tyrone -type f -name "*.txt" -exec grep -l "hello world"  {} \;`
    
    #输出结果
    /home/tyrone/test1.txt:mailx
    
    #方法4:同3
    find /home/tyrone -name "*.txt" -exec grep -l "hello world" {} \; | xargs grep -i "mailx"
    
    #输出结果
    /home/tyrone/test1.txt:mailx
    

    最后不得不感慨一下linux命令的组合方式,能像积木一样堆积出无穷的组合,是时候展现真正的想象力了。。。

    (4)查找指定用户的进程
    ps是查看当前进程的指令,e表示所有进程,f表示全格式。

    ps -ef | grep "tyrone"
    
    #输出结果
    root      27200  1827  0 Jun15 ?        00:00:00 sshd: tyrone [priv]
    tyrone    27434 27433  0 Jun15 pts/50   00:00:00 -bash
    tyrone    43316 27434  2 02:14 pts/50   00:00:00 ps -ef
    tyrone    43317 27434  0 02:14 pts/50   00:00:00 grep tyrone
    

    三、团结就是力量

    现在要搞一个脚本把前面总结的命令一锅炖了。先搜索同时匹配多个模式的文件,把它们先备份之后,替换目标字符串:

    #----------------------/home/tyrone/myshell.ksh---------------------
    #! /bin/ksh
    
    grep "hello world" -rl /home/tyrone | xargs grep -l "mailx" > /home/tyrone/result5.txt
    cat result5.txt | while read line
    do
        cp ${line} ${line}.bak20150616
        sed -i "s/hello world/letitia/g" `grep "hello world" -rl ${line}`
    done
    
    #输出结果:只有test1.txt满足条件,将"hello world"替换成了"letitia"
    #哦对了。。还有我的shell文件也同时包含了这两个模式,可以通过find限定文件后缀,不表
    #----------------------/home/tyrone/text1.txt---------------------
    letitia
    mailx
    uuen
    letitia
    #----------------------/home/tyrone/text2.txt---------------------
    hello world,this is for grep test 
    #----------------------/home/tyrone/text3.txt---------------------
    hello world
    tyrone
    #----------------/home/tyrone/text1.txt.bak20150616---------------
    hello world
    mailx
    uuen
    letitia
    

    四、下回分解

    grep与正则表达式的故事

    相关文章

      网友评论

        本文标题:grep 命令详解

        本文链接:https://www.haomeiwen.com/subject/yptbsttx.html