cut用法

作者: XieRuii | 来源:发表于2019-05-07 16:22 被阅读0次

一、定义

  正如其名,cut的工作就是“剪”,具体的说就是在文件中负责剪切数据用的。cut是以每一行为一个处理对象的,这种机制和sed是一样的。

2、剪切依据

cut命令主要是接受三个定位方法:

第一,字节(bytes),用选项-b

第二,字符(characters),用选项-c

第三,域(fields),用选项-f

例:

一,按字节cut:

注意:一个空格算一个字节,一个汉字算三个字节

[root@localhost ~]# date

2011年08月11日 星期四20:44:52 EDT

[root@localhost ~]# date |cut -b 1-4                取前四个字节

2011

[root@localhost ~]# date |cut -b 1-6

2011

[root@localhost ~]# date |cut -b 1-7          一个汉字算三个字节

2011年

[root@localhost ~]# date |cut -b 1-10

2011年08

多个定位之间用逗号隔开:

[root@localhost ~]# date |cut -b 1-7,10

2011年8

[root@localhost ~]# date |cut -b 10,1-7  cut会先把-b后面所有的定位进行从小到大排序,然后再提取

2011年8

负号的使用:

[root@localhost ~]# date |cut -b -4

2011

[root@localhost ~]# date |cut -b 4-

1年08月11日 星期四21:05:30 EDT

[root@localhost ~]# date |cut -b -4,4-

2011年08月11日 星期四21:06:53 EDT

-4表示从第一个字节到第四个字节,而4-表示从第四个字节到行尾。这两种情况下,都包括了第4个字节“1”。如果我执行date |cut -b -4,4-,会输出整行,不会出现连续两个重叠的1

二,按字符cut:

按字符cut相对比较简单,中文字符和空格都算一个字符。

[root@localhost ~]# date |cut -c 1-5

2011年

[root@localhost ~]# date |cut -c 5,9,13

年月日

三、按域cut

以/etc/passwd文件为例:

[root@localhost ~]# head -n5 /etc/passwd |cut -d : -f 1,3-5

root:0:0:root

bin:1:1:bin

daemon:2:2:daemon

adm:3:4:adm

lp:4:7:lp

-d指定域分隔符,-f 指定要剪出哪几个域,这个与awk的输出特定字段功能一样。

-d选项的默认间隔符就是制表符,所以当你就是要使用制表符的时候,完全就可以省略-d选项,而直接用-f来取域就可以了

如何分的清空格和制表符?

[root@localhost ~]# cat test            这个文件各单词间存在单个空格、制表符和多个空格

data11【单个空格 】data12 【制表符】data13     

data21【多个空格】data22【单个空格】data23           

data31 【单个空格 】data32 【  多个空格data33     

[root@localhost ~]# sed -n l test          用sed命令可以让制表符原形毕露~

data11 data12\tdata13$

data21 data22 data23$

data31 data32    data33$

[root@localhost ~]# cat test |cut  -f 2

data13

data21  data22 data23

data31 data32    data33

[root@localhost ~]# cat test |cut -d "  " -f 2          cut的间隔符只允许是一个字符

cut: the delimiter must be a single character

请尝试执行“cut --help”来获取更多信息。

[root@localhost ~]# cat test |cut -d " " -f 2         

data12 data13        中间那个空白字符是制表符

                                第一个空格后面还是空格,所以输出空格

data32                  单个空格后面就是data32           

相关文章

  • cut用法

    一、定义 正如其名,cut的工作就是“剪”,具体的说就是在文件中负责剪切数据用的。cut是以每一行为一个处理对...

  • cut命令用法

    一、用法 使用特定的规则切分文件内容并显示出来,命令格式cut file "m,n"。 -b:根据字节选取内容。 ...

  • 2018-06-01 课堂笔记

    目录cutsortwcuniqteetrsplit扩展知识 1. cut 数据截取, 以行为单位进行 1.1 用法...

  • 使用deeptools将bam文件转换为bw文件

    整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。 deepto...

  • 使用deeptools生成ChIP-seq信号热图与谱图

    整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。 deepto...

  • BOWTIE2 进行基因组比对

    整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。 Bowtie...

  • MACS2 进行peak calling

    整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。 MACS2 ...

  • 使用deeptools计算ChIP-seq样本之间的相关性

    整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。 当我们需要评...

  • 切,你知道几个cut的意思?

    每次查词典,都觉得自己懂得真少 今天咱们就做个小测试 你知道“cut”的几种意思和用法? 01 基...

  • bedtools intersect简单介绍

    整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。 一般而言,我...

网友评论

      本文标题:cut用法

      本文链接:https://www.haomeiwen.com/subject/lbcyoqtx.html