美文网首页
LINUX sed命令的使用

LINUX sed命令的使用

作者: cppcwang | 来源:发表于2017-10-24 15:07 被阅读118次

    LINUX sed命令的使用

    • 命令格式
    sed [options] 'command' file(s) 
    sed [options] -f scriptfile file(s)
    
    • sed常用命令
    a\ 在当前⾏下⾯插⼊⽂本。 
    i\ 在当前⾏上⾯插⼊⽂本。 
    c\ 把选定的⾏改为新的⽂本。 
    d 删除,删除选择的⾏。 
    D 删除模板块的第⼀⾏。 
    s 替换指定字符  
    l 列表不能打印字符的清单。 
    n 读取下⼀个输⼊⾏,⽤下⼀个命令处理新的⾏⽽不是⽤第⼀个命令。 
    N 追加下⼀个输⼊⾏到模板块后⾯并在⼆者间嵌⼊⼀个新⾏,改变当前⾏号码。 
    p 打印模板块的⾏。 
    P(⼤写) 打印模板块的第⼀⾏。 
    q 退出Sed。  
    w file 写并追加模板块到file末尾。   
    W file 写并追加模板块的第⼀⾏到file末尾。   
    
    • sed替换标记
    g 表⽰⾏内全⾯替换。   
    p 表⽰打印⾏。   
    w 表⽰把⾏写⼊⼀个⽂件。   
    x 表⽰互换模板块中的⽂本和缓冲区中的⽂本。   
    y 表⽰把⼀个字符翻译为另外的字符(但是不⽤于正则表达式) 
    \1 ⼦串匹配标记 
    & 已匹配字符串标记
    
    • sed元字符集
    ^ 匹配⾏开始,如:/^sed/匹配所有以sed开头的⾏。 
    $ 匹配⾏结束,如:/sed$/匹配所有以sed结尾的⾏。 
    . 匹配⼀个⾮换⾏符的任意字符,如:/s.d/匹配s后接⼀个任意字符,最后是d。 
    * 匹配0个或多个字符,如:/*sed/匹配所有模板是0个或多个空格后紧跟sed的⾏。 
    [] 匹配⼀个指定范围内的字符,如/[sS]ed/匹配sed和Sed。   
    
    [^] 匹配⼀个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的⼀个字⺟开头,紧跟ed的⾏。 
    
    \(..\) 匹配⼦串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。
    
    & 保存搜索字符⽤来替换其他字符,如s/love/**&**/,love这成**love**。 
    \< 匹配单词的开始,如:/\<love/匹配包含以love开头的单词的⾏。 
    \> 匹配单词的结束,如/love\>/匹配包含以love结尾的单词的⾏。 
    x\{m\} 重复字符x,m次,如:/0\{5\}/匹配包含5个0的⾏。 
    x\{m,\} 重复字符x,⾄少m次,如:/0\{5,\}/匹配⾄少有5个0的⾏。 
    x\{m,n\} 重复字符x,⾄少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的⾏。
    
    • 已匹配字符串标记&
    正则表达式 \w\+ 匹配每⼀个单词,使⽤ [&] 替换它,& 对应于之前所匹配到的单词:
    echo this is a test line | sed 's/\w\+/[&]/g' 
    [this] [is] [a] [test] [line]
    所有以192.168.0.1开头的⾏都会被替换成它⾃已加localhost:
    sed 's/^192.168.0.1/&localhost/' file 
    192.168.0.1localhost
    
    • ⼦串匹配标记\1
    匹配给定样式的其中⼀部分:
    echo this is digit 7 in a number | sed 's/digit \([0-9]\)/\1/' 
    this is 7 in a number
    命令中 digit 7,被替换成了 7。样式匹配到的⼦串是 7,\(..\) ⽤于匹配⼦串,对于匹配到的第⼀个⼦串就标记为 \1,依此类
    推匹配到的第⼆个结果就是 \2,例如:
    echo aaa BBB | sed 's/\([a-z]\+\) \([A-Z]\+\)/\2 \1/' 
    BBB aaa
    
    • 选定⾏的范围:,(逗号)
    所有在模板test和check所确定的范围内的⾏都被打印:
    sed -n '/test/,/check/p' file
    打印从第5⾏开始到第⼀个包含以test开始的⾏之间的所有⾏:
    sed -n '5,/^test/p' file
    对于模板test和west之间的⾏,每⾏的末尾⽤字符串aaa bbb替换:
    sed '/test/,/west/s/$/aaa bbb/' file
    
    • 多点编辑:e命令
    -e选项允许在同⼀⾏⾥执⾏多条命令:
    sed -e '1,5d' -e 's/test/check/' file
    上⾯sed表达式的第⼀条命令删除1⾄5⾏,第⼆条命令⽤check替换test。命令的执⾏顺序对结果有影响。如果两个命令都是替换
    命令,那么第⼀个替换命令将影响第⼆个替换命令的结果。
    和 -e 等价的命令是 --expression:
    sed --expression='s/test/check/' --expression='/love/d' file
    
    • 示例
    >gi|1002620271|ref|NC_029525.1| Coturnix japonica isolate 7356 chromosome 10, Coturnix japonica 2.0, whole genome shotgun sequence
    TACTCCCCAAGAA
    通过sed命令,将其更改为
    >NC_029525.1
    TACTCCCCAAGAA
    命令如下:
    sed 's/^[^ ]*[|]\([^|]*\)[|].*$/>\1/' original.fasta > updated.fasta
    命令拆解:
    该命令通过贪婪匹配匹配倒数第二个|,为了保险采用[|],[|]限定匹配内容,最后\1调用匹配行的子串
    贪婪匹配符:"." "+" "*"
    非贪婪匹配:"?"
    

    http://man.linuxde.net/sed

    相关文章

      网友评论

          本文标题: LINUX sed命令的使用

          本文链接:https://www.haomeiwen.com/subject/gxtxpxtx.html