sed命令详解

作者: tyrone_li | 来源:发表于2016-08-19 22:59 被阅读1302次

    1. 简介

    sed命令是一个很强大的文本编辑器,可以对来自文件、以及标准输入的文本进行编辑。

    执行时,sed会从文件或者标准输入中读取一行,将其复制到缓冲区,对文本编辑完成之后,读取下一行直到所有的文本行都编辑完毕。

    所以sed命令处理时只会改变缓冲区中文本的副本,如果想要直接编辑原文件,可以使用-i选项或者将结果重定向到新的文件中。

    sed命令的基本语法如下:

    sed [options] commands [inputfile...]
    

    options表示sed命令的一些选项,常见的选项如下表:

    选项名 作用
    -n 取消默认输出
    -e 多点编辑,可以执行多个子命令
    -f 从脚本文件中读取命令(sed操作可以事先写入脚本,然后通过-f读取并执行)
    -i 直接编辑原文件
    -l 指定行的长度
    -r 在脚本中使用扩展表达式

    2. 应用场景

    sed命令比较适用于大的文本文件,用普通文本编辑器难以胜任的情况。下面分别介绍直接打印、插入、删除、替换等编辑操作。
       实验用文件内容

    #===================test1.txt======================
    letitia
    mail
    uuencode
    1003605091
    01566
    

    (1)行打印,输出缓冲区内容,使用sed的p子命令

    sed '1,3 p' test1.txt
    echo "====================="
    sed -n '1,3 p' test1.txt
    
    #输出结果
    letitia
    letitia
    mail
    mail
    uuencode
    uuencode
    1003605091
    01566
    =====================
    letitia
    mail
    uuencode
    

    p子命令代表print,可以打印出sed缓冲区内的内容。
    sed命令中,直接采用数字代表某个特定的文本行:'1 p'代表打印第一行;'1,3 p'代表打印1到3行;特别的,最后一行的行号为$。

    观察输出结果,不使用-n选项时,sed命令把1到3行输出了两次。这是因为不使用-n时,sed首先读取一行,并默认将缓冲区内的文本输出出来,之后p子命令再次输出。使用-n时,默认输出取消,只有p子命令的输出结果。

    sed -n '/^ma/,5 p' test1.txt
    
    #输出结果
    mail
    uuencode
    1003605091
    01566
    

    sed命令支持正则表达式定位。语法为/re/,re表示正则表达式。
    本例表示打印出从匹配正则表达式的地方到第5行,也就是从匹配以ma开头的文本行处开始。

    sed -n '1~2 p' test1.txt
    
    #输出结果
    letitia
    uuencode
    01566
    

    1~2表示从第一行开始,行号递增2输出,即输出奇数行。语法格式为first~step

    (2)插入文本行,追加文本行
    这两种情况很类似。插入文本使用i子命令,表示在指定位置前面插入文本;追加文本使用a子命令,表示在指定位置之后插入文本。观察一下两个的区别:

    sed -n -e '2 i insert' -e '1,4 p' test1.txt 
    
    #-e选项表示多个子命令,本例执行i子命令之后执行了p子命令
    #输出结果
    letitia
    insert
    mail
    uuencode
    1003605091
    
    sed -n -e '2 a insert' -e '1,4 p' test1.txt
    
    #输出结果
    letitia
    mail
    insert
    uuencode
    1003605091
    

    (3)删除文本行,使用d子命令

    sed -n -e '2 d' -e '1,$ p' test1.txt
    
    #输出结果
    letitia
    uuencode
    1003605091
    01566
    

    (4)替换文本行,使用c子命令

    sed -n -e '2 c newmail' -e '1,$ p' test1.txt
    
    #输出结果
    letitia
    newmail
    uuencode
    1003605091
    01566
    

    【注】以上均未使用-i选项,所以更改的只是副本。

    <b>(5)替换指定文本,使用s子命令</b>
    这一个命令实用性很广,并且灵活。语法也比之上面特别一些:

    sed '位置参数 s/pattern/replaced/[flag]'
    

    pattern为要替换的文本,支持正则表达式,replaced表示用来替换的一般字符串(不支持正则表达式)。

    flag是替换标志,用来影响匹配替换的规则:

    flag 用法
    g 全局匹配,会替换文本行中所有匹配的字符串
    十进制n 替换文本行中第n个匹配的字符串
    p 替换第一个匹配的字符串,并且将缓冲区输出到标准输出
    w 替换第一个匹配的字符串,并且将改动的行输出到磁盘文件中
    缺省 替换第一个匹配的字符串
    sed -n -e 's/[0-9]\{10\}/miss letitia/g' -e '1,$ p' test1.txt
    #{}要转义,因为此处使用的不是扩展正则表达式
    
    #输出结果
    letitia
    mail
    uuencode
    miss letitia
    01566
    
    sed -n -e '1,/^ma/ s/l/L/g' -e '1,$ p' test1.txt
    
    #输出结果
    Letitia
    maiL
    uuencode
    miss letitia
    01566
    #可以看到,本例将前两行里的l替换为L。
    
    sed -n '1,3{
                s/l/L/g
                s/e/E/g
                2 i tyrone
                p
                }' test1.txt
    
    #输出结果
    LEtitia
    tyrone
    maiL
    uuEncodE
    

    最后这个例子比较复杂。使用大括号,表示对1到3行做了一组操作。

    3. 其他的小事

    • 以上都是采用了文件输入做实验,也可以采用其他方式,例如
    sed -i "s/letitia/hello world/g" `grep "letitia" -rl test1.txt`
    #将grep的结果作为输入,注意要用反引号括起来,将括号内部分解释为linux命令
    
    • 当用户的编辑操作比较复杂时,建议使用sed脚本文件。
    • 同正则表达式一样,匹配元字符时要用转义。使用基本正则表达式时,{}等也要转义。

    相关文章

      网友评论

      本文标题:sed命令详解

      本文链接:https://www.haomeiwen.com/subject/qrzbsttx.html