美文网首页Linux Shell
22. Linux sed命令

22. Linux sed命令

作者: 姜淑均 | 来源:发表于2017-09-15 10:32 被阅读37次

    Linux sed命令是利用script来处理文本文件。
    sed可依照script的指令,来处理、编辑文本文件。
    Sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。

    sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用重定向存储输出。

    sed维护着两个数据缓冲区:一个活动的模版空间(pattern space),另一个辅助的保留空间(hold space),初始都是空的,没有数据。
    1、sed从输入中读取一行文本,去掉行尾可能的换行符(\n)后放到模版空间里;
    2、用指定的执行脚本中的命令依次来处理模版空间里数据,直到脚本结束;
    3、向模版空间中的数据尾添加上换行符(没有进行去换行符操作就不添加),显示输出(选项-n将阻止输出) 模版空间中的数据后清空模版空间;
    4、sed再读取下一行文本重复上面处理过程。
    5、上面的4步处理过程称为一个sed处理循环。而sed就是重复这循环直到遇到退出命令或文件处理完毕。
    注意:保留空间中的数据是保持不变的,除非有命令改变它。

    语法
    sed [-hnV][-e<script>][-f<script文件>][文本文件]
    
    参数说明:
    • -e<script>或--expression=<script> 以选项中指定的script来处理输入的文本文件。
    • -f<script文件>或--file=<script文件> 以选项中指定的script文件来处理输入的文本文件。
    • -h或--help 显示帮助。
    • -n或--quiet或--silent 仅显示script处理后的结果。
    • -V或--version 显示版本信息。
    • -r sed 的动作支援的是延伸型正规表示法的语法。(预设是基础正规表示法语法)
    • -i直接修改读取的档案内容,而不是由萤幕输出。
    动作说明:
    • a :新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
    • c :取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
    • d :删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
    • i :插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
    • p :列印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行~
    • s :取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正则表达式!例如 1,20s/old/new/g 就是啦!
    • h 拷贝模板块的内容到内存中的缓冲区。
    • H 追加模板块的内容到内存中的缓冲区。
    • g 获得内存缓冲区的内容,并替代当前模板块中的文本。
    • G 获得内存缓冲区的内容,并追加到当前模板块文本的后面。
    • n 读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
    • N 追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
    • q 退出Sed。
    • w file 写并追加模板块到file末尾。
    • W file 写并追加模板块的第一行到file末尾。
    • ! 表示后面的命令对所有没有被选定的行发生作用。
    • = 打印当前行号码。
    • # 把注释扩展到下一个换行符以前。
    sed替换标记
    • g 表示行内全面替换。
    • p 表示打印行。
    • w 表示把行写入一个文件。
    • x 表示互换模板块中的文本和缓冲区中的文本。
    • y 表示把一个字符翻译为另外的字符(但是不用于正则表达式)
    • \1 子串匹配标记
    • & 已匹配字符串标记
    sed元字符集
    • ^ 匹配行开始,如:/^sed/匹配所有以sed开头的行。
    • $ 匹配行结束,如:/sed$/匹配所有以sed结尾的行。
    • . 匹配一个非换行符的任意字符,如:/s.d/匹配s后接一个任意字符,最后是d。 * 匹配0个或多个字符,如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。
    • [] 匹配一个指定范围内的字符,如/[ss]ed/匹配sed和Sed。
    • [^] 匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。
    • (..) 匹配子串,保存匹配的字符,如s/(love)able/\1rs,loveable被替换成lovers。
    • & 保存搜索字符用来替换其他字符,如s/love/&/,love这成love
    • < 匹配单词的开始,如:/<love/匹配包含以love开头的单词的行。
    • > 匹配单词的结束,如/love>/匹配包含以略结尾的单词的行。
    • x{m} 重复字符x,m次,如:/0{5}/匹配包含5个0的行。
    • x{m,} 重复字符x,至少m次,如:/0{5,}/匹配至少有5个0的行。
    • x{m,n} 重复字符x,至少m次,不多于n次,如:/0{5,10}/匹配5~10个0的行。

    实例

    在testfile文件的第四行后添加一行,并将结果输出到标准输出,在命令行提示符下输入如下命令:

    sed -e 4a\newLine testfile 
    

    首先查看testfile中的内容如下:

    $ cat testfile #查看testfile 中的内容  
    HELLO LINUX!  
    Linux is a free unix-type opterating system.  
    This is a linux testfile!  
    Linux test 
    

    使用sed命令后,输出结果如下:

    $ sed -e 4a\newline testfile #使用sed 在第四行后添加新字符串  
    HELLO LINUX! #testfile文件原有的内容  
    Linux is a free unix-type opterating system.  
    This is a linux testfile!  
    Linux test  
    newline 
    

    以行为单位的新增/删除

    将 /etc/passwd 的内容列出并且列印行号,同时,请将第 2~5 行删除!

    [root@www ~]# nl /etc/passwd | sed '2,5d'   //nl命令用于计算文件中行号。nl可以将输出的内容自动加上行号,其可以将行号做比较多的显示设计,包括位数和是否自动补0等等的功能。
    1 root:x:0:0:root:/root:/bin/bash
    6 sync:x:5:0:sync:/sbin:/bin/sync
    7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
    .....(后面省略).....
    

    sed 的动作为 '2,5d' ,那个 d 就是删除!因为 2-5 行给他删除了,所以显示的数据就没有 2-5 行罗~ 另外,注意一下,原本应该是要下达 sed -e 才对,没有 -e 也行啦!同时也要注意的是, sed 后面接的动作,请务必以 '' 两个单引号括住喔!

    只要删除第 2 行

    nl /etc/passwd | sed '2d' 
    

    要删除第 3 到最后一行

    nl /etc/passwd | sed '3,$d' 
    

    在第二行后(亦即是加在第三行)加上『drink tea?』字样!

    [root@www ~]# nl /etc/passwd | sed '2a drink tea'
    1 root:x:0:0:root:/root:/bin/bash
    2 bin:x:1:1:bin:/bin:/sbin/nologin
    drink tea
    3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
    .....(后面省略).....
    

    那如果是要在第二行前

    nl /etc/passwd | sed '2i drink tea' 
    

    如果是要增加两行以上,在第二行后面加入两行字,例如『Drink tea or .....』与『drink beer?』

    [root@www ~]# nl /etc/passwd | sed '2a Drink tea or ......\ndrink beer ?'
    1 root:x:0:0:root:/root:/bin/bash
    2 bin:x:1:1:bin:/bin:/sbin/nologin
    Drink tea or ......
    drink beer ?
    3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
    .....(后面省略).....
    

    增加多行字符串

    # nl /etc/passwd | sed '1,3a drink tea' #第一行到第三行后增加字符串"drink tea"
    

    以行为单位的替换与显示

    将第2-5行的内容取代成为『No 2-5 number』呢?

    [root@www ~]# nl /etc/passwd | sed '2,5c No 2-5 number'
    1 root:x:0:0:root:/root:/bin/bash
    No 2-5 number
    6 sync:x:5:0:sync:/sbin:/bin/sync
    .....(后面省略).....
    

    透过这个方法我们就能够将数据整行取代了!
    仅列出 /etc/passwd 文件内的第 5-7 行

    [root@www ~]# nl /etc/passwd | sed -n '5,7p'
    5 lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
    6 sync:x:5:0:sync:/sbin:/bin/sync
    7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
    

    可以透过这个 sed 的以行为单位的显示功能, 就能够将某一个文件内的某些行号选择出来显示。

    搜索 /etc/passwd有root关键字的行

    nl /etc/passwd | sed '/root/p'
    1  root:x:0:0:root:/root:/bin/bash
    1  root:x:0:0:root:/root:/bin/bash
    2  daemon:x:1:1:daemon:/usr/sbin:/bin/sh
    3  bin:x:2:2:bin:/bin:/bin/sh
    4  sys:x:3:3:sys:/dev:/bin/sh
    5  sync:x:4:65534:sync:/bin:/bin/sync
    ....下面忽略 
    

    如果root找到,除了输出所有行,还会输出匹配行。
    使用-n的时候将只打印包含模板的行。

    nl /etc/passwd | sed -n '/root/p'
    1  root:x:0:0:root:/root:/bin/bash
    

    数据的搜寻并删除

    删除/etc/passwd所有包含root的行,其他行输出

    nl /etc/passwd | sed  '/root/d'
    2  daemon:x:1:1:daemon:/usr/sbin:/bin/sh
    3  bin:x:2:2:bin:/bin:/bin/sh
    ....下面忽略
    #第一行的匹配root已经删除了
    
    删除空白行
    sed '/^$/d' file
    

    数据的搜寻并执行命令

    搜索/etc/passwd,找到root对应的行,执行后面花括号中的一组命令,每个命令之间用分号分隔,这里把bash替换为blueshell,再输出这行:

    nl /etc/passwd | sed -n '/bash/{s/bash/blueshell/;p;q}'    
    1  root:x:0:0:root:/root:/bin/blueshell
    

    最后的q是退出。

    数据的搜寻并替换

    除了整行的处理模式之外, sed 还可以用行为单位进行部分数据的搜寻并取代。基本上 sed 的搜寻与替代的与 vi 相当的类似!他有点像这样:(使用后缀 /g 标记会替换每一行中的所有匹配)

    sed 's/要被取代的字串/新的字串/g'
    
    # sed 's/book/books/g' file
    

    当需要从第N处匹配开始替换时,可以使用 /Ng:

    # echo sksksksksksk | sed 's/sk/SK/2g'
    skSKSKSKSKSK
    

    以上命令中字符 / 在sed中作为定界符使用,也可以使用任意的定界符:

    # sed 's:test:TEXT:g' 
    # sed 's|test|TEXT|g'
    

    定界符出现在样式内部时,需要进行转义:

    # sed 's/\/bin/\/usr\/local\/bin/g'
    

    先观察原始信息,利用 /sbin/ifconfig 查询 IP

    [root@www ~]# /sbin/ifconfig eth0
    eth0 Link encap:Ethernet HWaddr 00:90:CC:A6:34:84
    inet addr:192.168.1.100 Bcast:192.168.1.255 Mask:255.255.255.0
    inet6 addr: fe80::290:ccff:fea6:3484/64 Scope:Link
    UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
    .....(以下省略).....
    

    本机的ip是192.168.1.100。
    将 IP 前面的部分予以删除

    [root@www ~]# /sbin/ifconfig eth0 | grep 'inet addr' | sed 's/^.*addr://g'
    192.168.1.100 Bcast:192.168.1.255 Mask:255.255.255.0
    

    接下来则是删除后续的部分,亦即: 192.168.1.100 Bcast:192.168.1.255 Mask:255.255.255.0
    将 IP 后面的部分予以删除

    [root@www ~]# /sbin/ifconfig eth0 | grep 'inet addr' | sed 's/^.*addr://g' | sed 's/Bcast.*$//g'
    192.168.1.100
    
    已匹配字符串标记&

    正则表达式 \w+ 匹配每一个单词,使用 [&] 替换它,& 对应于之前所匹配到的单词

    # echo this is a test line | sed 's/\w\+/[&]/g' 
    [this] [is] [a] [test] [line]
    
    子串匹配标记\1

    匹配给定样式的其中一部分:

    # echo this is digit 7 in a number | sed 's/digit \([0-9]\)/\1/' 
    this is 7 in a number
    

    命令中 digit 7,被替换成了 7。样式匹配到的子串是 7,(..) 用于匹配子串,对于匹配到的第一个子串就标记为 \1,依此类推匹配到的第二个结果就是 \2,例如:

    # echo aaa BBB | sed 's/\([a-z]\+\) \([A-Z]\+\)/\2 \1/' 
    BBB aaa
    

    love被标记为1,所有loveable会被替换成lovers,并打印出来:

    # sed -n 's/\(love\)able/\1rs/p' file
    

    多点编辑

    一条sed命令,删除/etc/passwd第三行到末尾的数据,并把bash替换为blueshell

    nl /etc/passwd | sed -e '3,$d' -e 's/bash/blueshell/'
    1  root:x:0:0:root:/root:/bin/blueshell
    2  daemon:x:1:1:daemon:/usr/sbin:/bin/sh
    

    -e表示多点编辑,第一个编辑命令删除/etc/passwd第三行到末尾的数据,第二条命令搜索bash替换为blueshell。命令的执行顺序对结果有影响。如果两个命令都是替换命令,那么第一个替换命令将影响第二个替换命令的结果。

    组合多个表达式

    sed '表达式' | sed '表达式' 
    等价于: 
    sed '表达式; 表达式'
    

    引用

    sed表达式可以使用单引号来引用,但是如果表达式内部包含变量字符串,就需要使用双引号。

    test=hello 
    echo hello WORLD | sed "s/$test/HELLO/" 
    HELLO WORLD
    

    选定行的范围:,(逗号)

    所有在模板test和check所确定的范围内的行都被打印:

    sed -n '/test/,/check/p' file
    

    打印从第5行开始到第一个包含以test开始的行之间的所有行:

    sed -n '5,/^test/p' file
    

    对于模板test和west之间的行,每行的末尾用字符串aaa bbb替换:

    sed '/test/,/west/s/$/aaa bbb/' file
    

    从文件读入:r命令

    file里的内容被读进来,显示在与test匹配的行后面,如果匹配多行,则file的内容将显示在所有匹配行的下面:

    sed '/test/r file' filename
    

    写入文件:w命令

    在example中所有包含test的行都被写入file里:

    sed -n '/test/w file' example
    

    追加(行下):a\命令

    将 this is a test line 追加到 以test 开头的行后面:

    sed '/^test/a\this is a test line' file
    

    插入(行上):i\命令

    将 this is a test line 追加到以test开头的行前面:

    sed '/^test/i\this is a test line' file
    

    下一个:n命令

    如果test被匹配,则移动到匹配行的下一行,替换这一行的aa,变为bb,并打印该行,然后继续:

    sed '/test/{ n; s/aa/bb/;p }' file
    

    变形:y命令

    把1~10行内所有abcde转变为大写,注意,正则表达式元字符不能使用这个命令:

    sed '1,10y/abcde/ABCDE/' file
    

    保持和获取:h命令和G命令

    在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,除非行被删除或者输出被取消,否则所有被处理的行都将 打印在屏幕上。接着模式空间被清空,并存入新的一行等待处理。

    sed -e '/test/h' -e '$G' file
    

    在这个例子里,匹配test的行被找到后,将存入模式空间,h命令将其复制并存入一个称为保持缓存区的特殊缓冲区内。第二条语句的意思是,当到达最后一行后,G命令取出保持缓冲区的行,然后把它放回模式空间中,且追加到现在已经存在于模式空间中的行的末尾。在这个例子中就是追加到最后一行。简单来说,任何包含test的行都被复制并追加到该文件的末尾。

    保持和互换:h命令和x命令

    互换模式空间和保持缓冲区的内容。也就是把包含test与check的行互换:

    sed -e '/test/h' -e '/check/x' file
    

    打印奇数行或偶数行

    方法1:

    sed -n 'p;n' test.txt #奇数行 
    sed -n 'n;p' test.txt #偶数行
    

    方法2:

    sed -n '1~2p' test.txt #奇数行 
    sed -n '2~2p' test.txt #偶数行
    

    直接修改文件内容(危险动作)

    sed 可以直接修改文件的内容,不必使用管道命令或数据流重导向! 不过,由於这个动作会直接修改到原始的文件,所以请你千万不要随便拿系统配置来测试! 我们还是使用下载的 regular_express.txt 文件来测试看看吧!
    利用 sed 将 regular_express.txt 内每一行结尾若为 . 则换成 !

    [root@www ~]# sed -i 's/\.$/\!/g' regular_express.txt
    

    利用 sed 直接在 regular_express.txt 最后一行加入『# This is a test』

    [root@www ~]# sed -i '$a # This is a test' regular_express.txt
    

    由於 $ 代表的是最后一行,而 a 的动作是新增,因此该文件最后新增『# This is a test』!
    sed 的『 -i 』选项可以直接修改文件内容,这功能非常有帮助!举例来说,如果你有一个 100 万行的文件,你要在第 100 行加某些文字,此时使用 vim 可能会疯掉!因为文件太大了!那怎办?就利用 sed 啊!透过 sed 直接修改/取代的功能,你甚至不需要使用 vim 去修订!

    相关文章

      网友评论

      本文标题:22. Linux sed命令

      本文链接:https://www.haomeiwen.com/subject/eohssxtx.html