命令
1. 类似命令
awk
2. 介绍
cut是以每一行为一个处理对象的,这种机制和sed一样。
cut接受三个定位方法:
1)byte: -b
2)characters: -c
3)fields: -d
eg:提取第3,4,5,9的字节: cut -b 3-5,9
注意:cut命令如果使用-b选项,执行时会先把-b后面所有的定位进行从小到大排序,然后再提取,不能颠倒顺序。
-3 表示从第一字节到第三字节;
3- 表示从第三字节到结尾。
对于中文提取,-c 会以字符为单位,输出正常;-b以字节(8位二进制)计算。
当遇到多字节字符时,使用-n选项,不会将多字节字符拆开。cut -nb 1,2,3
对于非固定格式信息,需要域。之前需要先设置间隔符,再提取第几个域。
cut -d : -f 1
-d设置间隔符为:,-f 1 为提取第一个域。
注意:如果遇到空格和制表符时,怎么辨认?
先检查这段空格是由空格组成还是制表符组成:
1
2
cat tab_space.txt
sed -n l tab_space,txt
如果是制表位(TAB),就会显示\t, 如果是空格,就会原样显示。(sed中n后面的l是小写的L)
cut -d 用什么符号表示制表符或空格?
cut -d 默认间隔为制表符,可以省略。若设置空格为间隔符,则 cut -d ' ' -f 4
(两个单引号中要有一个空格)
而且只能在-d 后面设置一个空格,不允许有多个空格。cut允许的间隔符是一个字符。
cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。
如果不指定 File 参数,cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一。
3. 实例
(1) 把root:x:0:0:root:/root:/bin/bash 重定向到cut命令里,-d表示分隔符,这里使用冒号: 作为分隔符,-f 表示字段,选择了第1,和第5个字段
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -d : -f 1,5
root:root
(2)只打印第一个字段field
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -d : -f 1
root
(3) 打印第一个字段以后的所有字段,包含第一个字段
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -d : -f 1-
root:x:0:0:root:/root:/bin/bash
(4) 打印第3个字段后的所有字段,包含第三个字段
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -d : -f 3-
0:0:root:/root:/bin/bash
(5) 截取第2到第4个字段
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -d : -f 2-4
x:0:0
(6) 截取指定个数的字符
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -c 2-5 // 截取第2到第5个字符
oot:
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -c 2-7 // 截取第2到第7个字符
oot:x:
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -c -2 // 截取前2个字符
ro
ws@pc-102:~$ echo root:x:0:0:root:/root:/bin/bash | cut -c 2- // 截取第2个以后的字符
oot:x:0:0:root:/root:/bin/bash
(7 )指定文件,最后一个参数是文件名
$ cat pass.txt
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
shuohailhl@shuohailhl-PC /cygdrive/d
$ cut -d : -f 1-3 ./pass.txt
root:x:0
bin:x:1
daemon:x:2
adm:x:3
网友评论