1. 简介
sed命令是一个很强大的文本编辑器,可以对来自文件、以及标准输入的文本进行编辑。
执行时,sed会从文件或者标准输入中读取一行,将其复制到缓冲区,对文本编辑完成之后,读取下一行直到所有的文本行都编辑完毕。
所以sed命令处理时只会改变缓冲区中文本的副本,如果想要直接编辑原文件,可以使用-i选项或者将结果重定向到新的文件中。
sed命令的基本语法如下:
sed [options] commands [inputfile...]
options表示sed命令的一些选项,常见的选项如下表:
选项名 | 作用 |
---|---|
-n | 取消默认输出 |
-e | 多点编辑,可以执行多个子命令 |
-f | 从脚本文件中读取命令(sed操作可以事先写入脚本,然后通过-f读取并执行) |
-i | 直接编辑原文件 |
-l | 指定行的长度 |
-r | 在脚本中使用扩展表达式 |
2. 应用场景
sed命令比较适用于大的文本文件,用普通文本编辑器难以胜任的情况。下面分别介绍直接打印、插入、删除、替换等编辑操作。
实验用文件内容
#===================test1.txt======================
letitia
mail
uuencode
1003605091
01566
(1)行打印,输出缓冲区内容,使用sed的p子命令
sed '1,3 p' test1.txt
echo "====================="
sed -n '1,3 p' test1.txt
#输出结果
letitia
letitia
mail
mail
uuencode
uuencode
1003605091
01566
=====================
letitia
mail
uuencode
p子命令代表print,可以打印出sed缓冲区内的内容。
sed命令中,直接采用数字代表某个特定的文本行:'1 p'
代表打印第一行;'1,3 p'
代表打印1到3行;特别的,最后一行的行号为$。
观察输出结果,不使用-n选项时,sed命令把1到3行输出了两次。这是因为不使用-n时,sed首先读取一行,并默认将缓冲区内的文本输出出来,之后p子命令再次输出。使用-n时,默认输出取消,只有p子命令的输出结果。
sed -n '/^ma/,5 p' test1.txt
#输出结果
mail
uuencode
1003605091
01566
sed命令支持正则表达式定位。语法为/re/
,re表示正则表达式。
本例表示打印出从匹配正则表达式的地方到第5行,也就是从匹配以ma开头的文本行处开始。
sed -n '1~2 p' test1.txt
#输出结果
letitia
uuencode
01566
1~2
表示从第一行开始,行号递增2输出,即输出奇数行。语法格式为first~step
。
(2)插入文本行,追加文本行
这两种情况很类似。插入文本使用i子命令
,表示在指定位置前面插入文本;追加文本使用a子命令
,表示在指定位置之后插入文本。观察一下两个的区别:
sed -n -e '2 i insert' -e '1,4 p' test1.txt
#-e选项表示多个子命令,本例执行i子命令之后执行了p子命令
#输出结果
letitia
insert
mail
uuencode
1003605091
sed -n -e '2 a insert' -e '1,4 p' test1.txt
#输出结果
letitia
mail
insert
uuencode
1003605091
(3)删除文本行,使用d子命令
sed -n -e '2 d' -e '1,$ p' test1.txt
#输出结果
letitia
uuencode
1003605091
01566
(4)替换文本行,使用c子命令
sed -n -e '2 c newmail' -e '1,$ p' test1.txt
#输出结果
letitia
newmail
uuencode
1003605091
01566
【注】以上均未使用-i选项,所以更改的只是副本。
<b>(5)替换指定文本,使用s子命令
</b>
这一个命令实用性很广,并且灵活。语法也比之上面特别一些:
sed '位置参数 s/pattern/replaced/[flag]'
pattern为要替换的文本,支持正则表达式,replaced表示用来替换的一般字符串(不支持正则表达式)。
flag是替换标志,用来影响匹配替换的规则:
flag | 用法 |
---|---|
g | 全局匹配,会替换文本行中所有匹配的字符串 |
十进制n | 替换文本行中第n个匹配的字符串 |
p | 替换第一个匹配的字符串,并且将缓冲区输出到标准输出 |
w | 替换第一个匹配的字符串,并且将改动的行输出到磁盘文件中 |
缺省 | 替换第一个匹配的字符串 |
sed -n -e 's/[0-9]\{10\}/miss letitia/g' -e '1,$ p' test1.txt
#{}要转义,因为此处使用的不是扩展正则表达式
#输出结果
letitia
mail
uuencode
miss letitia
01566
sed -n -e '1,/^ma/ s/l/L/g' -e '1,$ p' test1.txt
#输出结果
Letitia
maiL
uuencode
miss letitia
01566
#可以看到,本例将前两行里的l替换为L。
sed -n '1,3{
s/l/L/g
s/e/E/g
2 i tyrone
p
}' test1.txt
#输出结果
LEtitia
tyrone
maiL
uuEncodE
最后这个例子比较复杂。使用大括号,表示对1到3行做了一组操作。
3. 其他的小事
- 以上都是采用了文件输入做实验,也可以采用其他方式,例如
sed -i "s/letitia/hello world/g" `grep "letitia" -rl test1.txt`
#将grep的结果作为输入,注意要用反引号括起来,将括号内部分解释为linux命令
- 当用户的编辑操作比较复杂时,建议使用sed脚本文件。
- 同正则表达式一样,匹配元字符时要用转义。使用基本正则表达式时,{}等也要转义。
网友评论