美文网首页
Linux文件管理知识:文本处理

Linux文件管理知识:文本处理

作者: Linux大师 | 来源:发表于2023-11-08 10:13 被阅读0次

上篇文章详细介绍了Linux系统中查找文件的工具或者命令程序的相关操作内容介绍。那么,今天呢,这篇文章围绕Linux系统中文本处理来阐述。

众所周知,所有Linux操作系统都离不开一个核心原则,那就是它是由很多种文件组成的,那么,Linux系统的任何操作就离不开文本文件的处理。所以,它有很多命令工具用来处理文本的。在这篇文章中我们主要介绍下用于文本格式化输出及其它常用的命令工具。

常见的命令工具如下:

命令(工具)名称描述

cat用于连接文件并且打印到标准输出

sort用于给文本行排序

uniq用于报告或者省略重复行

cut用于从每行中删除文本区域

paste用于合并文件文本行

join用于基于某个共享字段来联合两个文件的文本行

comm用于逐行比较两个有序的文件

diff用于逐行比较文件

patch用于给原始文件打补丁

tr用于翻译或删除字符

sed用于筛选和转换文本的流编辑器

aspell用于交互式拼写检查器

接下来,我们先回顾下Linux系统文本处理工具。

Linux文本处理工具

说到Linux文本处理工具或者程序,我相信大家首先提到就是vim了。是的,没错!但是文本还可以用来做什么呢?这个值得大家思考!

在这里列举一些用途:

[if !supportLists]²  [endif]通过纯文本格式形式编写文档;

[if !supportLists]²  [endif]另一种文本文档格式就是网页,目前最常见的就是通过超文本标记语言HTML或可扩展的标记语言XML作为标记语言来实现的;

[if !supportLists]²  [endif]基于文本的电子邮件email;

[if !supportLists]²  [endif]纯文本格式格式化输出;

[if !supportLists]²  [endif]软件开发里的程序源码;.

cat-A命令程序

cat-A命令程序,可将文本非打印字符(比如说控制字符tab、空格、回车字符等)显示出来。

实例1:

第一步:创建测试文件或者实例

[root@linuxprobe~]$ cat > test1.txt

The food is delicious.    

[root@linuxprobe~]$

备注:

创建测试文件test1.txt,输入cat命令指定了用于重定向输出的文件test1.txt,随后输入文本内容“  Thefood

is delicious.  ”,最后回车Enter 键;使用Ctrl+D组合键指示cat命令。

需要注意的是测试文件test1.txt文本内容的开头和末尾分别使用了一个tab 字符以及一些空格。

第二步:刚刚创建的测试文件test1.txt文本内容通过cat-A命令显示出来:

[root@linuxprobe~]$ cat -A test1.txt

^IThe food isdelicious.. $

[root@linuxprobe~]$

结论:

在输出的显示结果中我们可以分析:

文本中的tab 字符由ˆI 字符来显示出来。

文本末尾的空格由$ 字符来显示出来。

实例2:

第一步:创建测试文件或者实例

[root@linuxprobe~]$ cat > test2.txt

It tastesdelicious,

and makes onerun at the mouth.    

[root@linuxprobe~]$

[root@linuxprobe~]$ cat -nstest2.txt      //-n:给文本行添加行号

-s:禁止输出多个空白行

1 It tastes delicious,

2

3 and makes one run at the mouth.

[root@linuxprobe~]$

备注:

重新创建了一个新的测试文件test2.txt,其文本内容为It tastes delicious,

and makes one

run at the mouth.并由两个空白行区分开。经过cat

-ns命令程序执行处理(给文本行添加行号,并将禁止输出多个空白行输出)输出显示出来。

sort命令程序

sort 命令程序针对指定的文本内容或命令行中指定的一个或多个内容进行排序,并将排序结果标准输出显示出来。

sort 程序来处理标准输入实例:

[root@linuxprobe~]$ sort test3.txt

2

3

1

[root@linuxprobe~]$ ccat test3.txt

将test1.txt test2.txt test3.txt三个文本文件合并为一个有序的文件sorted _test_list.txt。

Sort命令程序的常见选项参数如下表:

选项长选项描述

-b--ignore-leading-blanks默认情况下,对整行进行排序,从每行的第一个字符开始。这个选项导致sort 程序忽略每行开头的空格,从第一个非空白字符开始排序。

-f--ignore-case让排序不区分大小写。

-n--numeric-sort基于字符串的数值来排序。使用此选项允许根据数字值执行排序,而不是字母值。

-r--reverse按相反顺序排序。结果按照降序排列,而不是升序。

-k--key=field1[,field2]对从field1 到field2

  之间的字符排序,而不是整个文本行。看下面的讨论。

-m--merge把每个参数看作是一个预先排好序的文件。把多个文件合并成一个排好序的文件,而没有执行额外的排序。

-o--output=file把排好序的输出结果发送到文件,而不是标准输出。

-t--field-separator=char定义域分隔字符。默认情况下,域由空格或制表符分隔。

这篇文章主要介绍了cat及sort命令程序,它们是如何被用来执行文本处理操作的。

Linux系统知识博大精深,所以我在此强烈建议大家可以参考下《linux就该这么学》这本书,对于linux系统文本处理层面的介绍很详细!那么关于Linux系统中文本处理命令的操作及运用介绍先告一段落了,后期文章会一一补发。

相关文章

  • python编码问题

    Python中读取文件时报错UnicodeDecodeError 场景:文本处理 平台:linux red-hat...

  • 记录日常工作中常用的一些Linux命令,以后用的可以速查

    Linux常用命令收集 文件和目录 操作命令 文件搜索 命令 文件权限 操作命令 查看文件内容 命令 文本处理 命...

  • Linux shell文件及文本处理指令总结

    Linux shell文件及文本处理指令总结 《跟老男孩学linux运维读书笔记》 cat 显示文本$ cat f...

  • Linux 积累

    积累Linux知识,方便查找 Linux下去掉^M的方法 sed 功能说明:文本处理并可对文件进行编辑 conda...

  • 预习2019-03-22

    用户管理知识及应用 linux系统用户相关配置文件 linux系统中创建、增加,以及删除用户和用户组,实际都是修改...

  • Linux常用命令速查

    Linux常用命令: 文件和目录命令 查看文件内容 文本处理 查找 压缩和解压 yum工具 网络 其他 快捷键 引...

  • Let's awk!

    awk是Linux自带的一种文本处理工具,能够快速有效地对Linux下的文本文件进行处理,尤其针对较大的文本文件。...

  • 2019-11-29【生信技能树】P9 Linux-10-文本处

    【生信技能树】生信人应该这样学LinuxP9 linux-10-文本处理 Linux文本处理命令awk,grep,...

  • Linux常用的文本处理命令

    1. 总体介绍 Linux常用的文本处理命令 more/less: 逐屏显示文件 cat与od: 一次性列出文件内...

  • Linux文件管理知识汇总

    常见的重要目录的意义 ls -l输出的意义 第一列:规定了不同的用户对文件所拥有的权限。其中第一位表示文件的格式,...

网友评论

      本文标题:Linux文件管理知识:文本处理

      本文链接:https://www.haomeiwen.com/subject/iklqwdtx.html