20. Linux grep 命令

作者: 姜淑均 | 来源:发表于2017-09-06 11:03 被阅读45次

    Linux grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)命令用于查找文件里符合条件的字符串。

    grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到标准输出,不影响原文件内容。

    grep指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设grep指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为"-",则grep指令会从标准输入设备读取数据。

    Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。

    语法

    grep [-abcEFGhHilLnqrsvVwxy][-A<显示列数>][-B<显示列数>][-C<显示列数>][-d<进行动作>][-e<范本样式>][-f<范本文件>][--help][范本样式][文件或目录...]
    
    参数:
    • -a或--text 不要忽略二进制的数据, 将binary 文件以text 文件的方式搜寻数据。
    • -A<显示列数>或--after-context=<显示列数> 除了显示符合范本样式的那一列之外,并显示该列之后的内容。
    • -b或--byte-offset 在显示符合范本样式的那一列之前,标示出该列第一个字符的位编号。
    • -B<显示列数>或--before-context=<显示列数> 除了显示符合范本样式的那一列之外,并显示该列之前的内容。
    • -c或--count 计算符合范本样式的列数。
    • -C<显示列数>或--context=<显示列数>或-<显示列数> 除了显示符合范本样式的那一列之外,并显示该列之前后的内容。
    • -d<进行动作>或--directories=<进行动作> 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
    • -e<范本样式>或--regexp=<范本样式> 指定字符串做为查找文件内容的范本样式。
    • -E或--extended-regexp 将范本样式为延伸的普通表示法来使用。
    • -f<范本文件>或--file=<范本文件> 指定范本文件,其内容含有一个或多个范本样式,让grep查找符合范本条件的文件内容,格式为每列一个范本样式。
    • -F或--fixed-regexp 将范本样式视为固定字符串的列表。
    • -G或--basic-regexp 将范本样式视为普通的表示法来使用。
    • -h或--no-filename 在显示符合范本样式的那一列之前,不标示该列所属的文件名称。
    • -H或--with-filename 在显示符合范本样式的那一列之前,表示该列所属的文件名称。
    • -i或--ignore-case 忽略字符大小写的差别。
    • -l或--file-with-matches 列出文件内容符合指定的范本样式的文件名称。
    • -L或--files-without-match 列出文件内容不符合指定的范本样式的文件名称。
    • -n或--line-number 在显示符合范本样式的那一列之前,标示出该列的列数编号。
    • -q或--quiet或--silent 不显示任何信息。
    • -r或--recursive 此参数的效果和指定"-d recurse"参数相同。
    • -s或--no-messages 不显示错误信息。
    • -v或--revert-match 反转查找,即显示出没有 范本样式 内容的那一行!。
    • -V或--version 显示版本信息。
    • -w或--word-regexp 只显示全字符合的列。
    • -x或--line-regexp 只显示全列符合的列。
    • -y 此参数的效果和指定"-i"参数相同。
    • --help 在线帮助。

    grep常用用法

    1. 将/etc/passwd,有出现 root 的行取出来

    grep root /etc/passwd
    
    或
    
    cat /etc/passwd | grep root 
    

    2. 将/etc/passwd,有出现 root 的行取出来,同时显示这些行在/etc/passwd的行号

    grep -n root /etc/passwd
    

    注:在关键字的显示方面,grep 可以使用 --color=auto 来将关键字部分使用颜色显示。这可是个很不错的功能啊!但是如果每次使用 grep 都得要自行加上 --color=auto 又显的很麻烦~ 此时那个好用的 alias 就得来处理一下啦!你可以在 ~/.bashrc 内加上这行:『alias grep='grep --color=auto'』再以『 source ~/.bashrc 』来立即生效即可喔! 这样每次运行 grep 他都会自动帮你加上颜色显示啦。

    3. 将/etc/passwd,将没有出现 root 和nologin的行取出来

    grep -v root /etc/passwd | grep -v nologin
    

    4. 用 dmesg 列出核心信息,再以 grep 找出内含 eth 那行,要将捉到的关键字显色,且加上行号来表示

    dmesg | grep -n --color=auto 'eth'
    

    5. 用 dmesg 列出核心信息,再以 grep 找出内含 eth 那行,在关键字所在行的前两行与后三行也一起捉出来显示

    dmesg | grep -n -A3 -B2 --color=auto 'eth'
    

    6. 根据文件内容递归查找目录

    grep ‘energywise’ *        #在当前目录搜索带'energywise'行的文件
    
    grep -r ‘energywise’ *     #在当前目录及其子目录下搜索'energywise'行的文件
    
    grep -l -r ‘energywise’ *  
    

    这几个命令很使用,是查找文件的利器。

    在多级目录中对文本进行递归搜索

    grep "text" . -r -n 
    # .表示当前目录。
    

    7. 在当前目录中,查找后缀有"test"字样的文件中包含"test"字符串的文件,并打印出该字符串的行。

    $ grep test test* #查找后缀有“test”的文件包含“test”字符串的文件  
    
    testfile1:This a Linux testfile! #列出testfile1 文件中包含test字符的行  
    testfile_2:This is a linux testfile! #列出testfile_2 文件中包含test字符的行  
    testfile_2:Linux test #列出testfile_2 文件中包含test字符的行 
    

    8. 在多个文件中查找

    grep "match_pattern" file_1 file_2 file_3 ...
    

    9. 只输出文件中匹配到的部分 -o 选项

    echo this is a test line. | grep -o -E "[a-z]+\." 
    # line.
    

    10. 打印样式匹配所位于的字符或字节偏移

    echo gun is not unix | grep -b -o "not" 
    #7:not一行中字符串的字符偏移是从该行的第一个字符开始计算,起始值为0。选项 -b -o 一般总是配合使用。
    

    11. 选项 -e 制动多个匹配样式

    echo this is a text line | grep -e "is" -e "line" -o 
    # is 
    # line 
    
    #也可以使用-f选项来匹配多个样式,在样式文件中逐行写出需要匹配的字符。 
    
    cat patfile aaa bbb echo aaa bbb ccc ddd eee | grep -f patfile -o
    

    12. 在grep搜索结果中包括或者排除指定文件

    #只在目录中所有的.php和.html文件中递归搜索字符"main()" 
    grep "main()" . -r --include *.{php,html} 
    
    #在搜索结果中排除所有README文件 
    grep "main()" . -r --exclude "README" 
    
    #在搜索结果中排除filelist文件列表里的文件 
    grep "main()" . -r --exclude-from filelist
    

    13. 使用0值字节后缀的grep与xargs

    #测试文件: 
    echo "aaa" > file1 
    echo "bbb" > file2 
    echo "aaa" > file3 
    
    grep "aaa" file* -lZ | xargs -0 rm 
    #执行后会删除file1和file3,grep输出用-Z选项来指定以0值字节作为终结符文件名(\0),xargs -0 读取输入并用0值字节终结符分隔文件名,然后删除匹配文件,-Z通常和-l结合使用。
    

    14. grep静默输出

    grep -q "test" filename 
    #不会输出任何信息,如果命令运行成功返回0,失败则返回非0值。一般用于条件测试。
    

    15. 如果匹配结果有多个,会用“--”作为各匹配结果之间的分隔符

    echo -e "a\nb\nc\na\nb\nc" | grep a -A 1 
    #
    a 
    b 
    -- 
    a 
    b
    #
    

    扩展grep(grep -E 或者 egrep):

    使用扩展grep的主要好处是增加了额外的正则表达式元字符集。

    打印所有包含NW或EA的行。如果不是使用egrep,而是grep,将不会有结果查出。

    egrep 'NW|EA' testfile    
    或
    Grep –E  'NW|EA' testfile
     #   northwest       NW      Charles Main        3.0     .98     3       34
     #   eastern         EA      TB Savage           4.4     .84     5       20
    

    对于标准grep,如果在扩展元字符前面加\,grep会自动启用扩展选项-E。

    grep 'NW\|EA' testfile
    # northwest       NW      Charles Main        3.0     .98     3       34
    # eastern         EA      TB Savage           4.4     .84     5       20
    

    不使用正则表达式

    fgrep 查询速度比grep命令快,但是不够灵活:它只能找固定的文本,而不是规则表达式。

    相关文章

      网友评论

      本文标题:20. Linux grep 命令

      本文链接:https://www.haomeiwen.com/subject/jkmmjxtx.html