美文网首页
sed文本处理工具

sed文本处理工具

作者: 毛利卷卷发 | 来源:发表于2018-06-05 16:59 被阅读0次

    简介

    sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。如果没有使诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。

    功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等

    常用选项

    • -n:不输出模式空间内容到屏幕,即不自动打印
    • -e:多点编辑
    • -f /PATH/SCRIPT_FILE:从指定文件中读取编辑脚本
    • -r:支持使用扩展正则表达式
    • -i:不备份文件直接编辑
    • -i.bak:备份文件并原处编辑
    [root@centos7 app]# sed '' a
    nihao hello world 
    maobin zhangsan lisi
    wnagwu zhaoliu
    liubei zhangfei guangyu
    fanjie zhanglijuan
    [root@centos7 app]# sed -n '' a
    
    [root@centos7 app]# cat d
    1
    [root@centos7 app]# sed -i.bak 's/1/2/g' d
    [root@centos7 app]# cat d
    2
    [root@centos7 app]# cat d.bak 
    1
    

    地址定界

    先地址定界,在编辑命令,如果不地址定界,对全文进行处理

    #:指定行
    $:最后一行
    /pattern/:被此处模式所匹配到的每一行

    #,#:1,3 1到3行
    #,+#:1,3 1到4行
    /pat1/,/pat2/:匹配从模式1匹配到的行到模式2匹配到的行,如果模式1匹配到,而模式2没有匹配到,那么默认就把从最后一个模式1匹配到的行到尾行一起输出
    #,/pat1/:指定行到被模式1匹配到得第一行

    1~2:奇数行
    2~2:偶数行

    [root@centos7 app]# cat -n a | sed -n '$p'
        10  nihao
    [root@centos7 app]# cat -n a | sed -n '1~2p'
         1  nihao hello world 
         3  wnagwu zhaoliu
         5  fanjie zhanglijuan
         7  fanjie zhangsan
         9  fanjie
    [root@centos7 app]# cat -n a | sed -n '2~2p'
         2  maobin zhangsan lisi
         4  liubei zhangfei guangyu
         6  a b c
         8  ab cf
        10  nihao
    

    编辑命令

    d:删除模式空间匹配的行,并立即启用下一轮循环
    p:打印当前模式空间内容,追加到默认输出之后
    a TEXT:在指定行后面追加文本,支持使用\n实现多行追加
    i TEXT:在指定行前面插入文本,也可以配合\n
    c TEXT:替换指定行并追加文本,也可以配合\n
    w /path/somefile::保存模式匹配的行至指定文件
    r /path/somefile:在指定行后依次追加文件内容
    =:为模式空间中的行打印行号
    !:模式空间中匹配行取反处理

    s///:查找替换,支持使用其他分隔符,默认只替换行内第一个被匹配的
    s///g:行内全局替换,行内所有被匹配的都将被替换
    s///p:显示替换成功的行
    s///w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中
    s/root/&superman/p:词前追加
    s/root/superman&/p:词后追加

    [root@centos7 app]# sed -n 's/root/&superman/p' /etc/passwd
    rootsuperman:x:0:0:root:/root:/bin/bash
    operator:x:11:0:operator:/rootsuperman:/sbin/nologin
    [root@centos7 app]# sed -n 's/root/superman&/p' /etc/passwd
    supermanroot:x:0:0:root:/root:/bin/bash
    operator:x:11:0:operator:/supermanroot:/sbin/nologin
    

    高级编辑命令

    P:打印模式空间开端至\n内容,并追加到默认输出之前
    h:把模式空间中的内容覆盖至保持空间中
    H:把模式空间中的内容追加至保持空间中
    g:从保持空间取出数据覆盖至模式空间
    G:从保持空间取出内容追加至模式空间
    x:把模式空间中的内容与保持空间中的内容进行互换
    n:读取匹配到的行的下一行追加至模式空间
    N:读取匹配到的行的下一行追加至模式空间
    d:删除模式空间中的行
    D:如果模式空间包含换行符,则删除直到第一个换行符的模式空间中的文本,并不会读取新的输
    入行,而使用合成的模式空间重新启动循环。如果模式空间不包含换行符,则会像发出d命令那样
    启动正常的新循环

    示例

    sed -n 'n;p' FILE:仅打印偶数行
    sed 'n;d' FILE:仅打印奇数行
    sed '1!G;h;$!d' FILE:倒序打印
    sed 'N;D‘ FILE:打印最后一行
    sed '$!N;$!D' FILE:打印最后两行
    sed '$!d' FILE:打印最后一行
    sed ‘G’ FILE:每一行后加一个空行
    sed ‘g’ FILE:将所有行变为空行
    sed ‘/^$/d;G’ FILE:将非空行内容之间间隔一个空行打印
    sed -n '1!G;h;$p' FILE:倒序打印

    练习

    1. 删除centos7系统/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符

      [root@centos7 app]# cat /etc/grub2.cfg | sed 's/^[[:blank:]]\+//'
      
    2. 删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的#和空白字符

      [root@centos7 app]# cat /etc/fstab | sed 's/^#[[:blank:]]\+//'
      
    3. 在centos6系统/root/install.log每一行行首增加#号

      [root@centos6 ~]# cat /root/install.log | sed 's/./#&/'
      
      [root@centos6 ~]# cat /root/install.log | sed 's/^/#/'
      
    4. 在/etc/fstab文件中不以#开头的行的行首增加#号

      [root@centos7 app]# cat /etc/fstab | sed  's/^[^#]\|^$/#&/'
      
    5. 处理/etc/fstab路径,使用sed命令取出其目录名和基名

      [root@centos7 app]# echo /etc/fstab | sed 's/[^/]\+$/\n&/'
      
    6. 利用sed取出ifconfig命令中本机的IPv4地址

      [root@centos7 ~]# ifconfig ens33 | sed -n '2 s/.*inet[[:blank:]]\+//;s/[[:blank:]]\+netmask.*//p' 
      
    7. 统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数

      [root@centos7 app]# ls /media/Packages/ | grep -o '[^\.]\+\.rpm$' | sort | uniq -c
      
    8. 统计/etc/init.d/functions文件中每个单词的出现次数,并排序(用grep和sed两种方法分别实现)

      [root@centos6 ~]# cat /etc/init.d/functions | grep -o '[[:alpha:]]\+' | sort | uniq -c | sort -nr
      
      [root@centos6 ~]# cat /etc/init.d/functions | sed 's/[^[:alpha:]]\+/\n/g' | sed "/^$/ d" |sort |uniq -c |sort -nr
      
    9. 将文本文件的n和n+1行合并为一行,n为奇数行

      [root@centos7 app]# cat d | sed 'N;s/\n//'
      
    10. 写一个脚本可以进行手机号码抽奖,脚本为/root/bin/choujiang.sh,当执行脚本时,会对/app/mobile.txt文件进行随机抽奖,注意手机号中的第4位及之后的3位变成*

      #!/bin/bash
      # 取手机号总数
      mobileCount=`cat $1 | wc -l`
      
      # 取随机数
      random=$[$RANDOM%$mobileCount+1]
      
      # 取出中奖手机号
      luckyMobile=`cat $1 | sed -n "$random p"`
      
      # 给中奖号码打码
      mobileBegin=`echo "$luckyMobile" | grep -o '^[0-9]\{3\}'`
      mobileEnd=`echo "$luckyMobile" | grep -o '[0-9]\{4\}$'`
      echo "$mobileBegin****$mobileEnd"
      
      [root@centos7 ~]# echo 19935126712 | sed 's/\([0-9]\{3\}\)\([0-9]\{4\}\)\([0-9]\{4\}\)/\1****\3/g'
      

    相关文章

      网友评论

          本文标题:sed文本处理工具

          本文链接:https://www.haomeiwen.com/subject/hokmsftx.html