美文网首页
Linux 学习笔记(十二):文本处理命令

Linux 学习笔记(十二):文本处理命令

作者: Bocchi | 来源:发表于2019-02-18 20:34 被阅读0次

tr 命令


tr 命令用于删除一段文本信息中的某些文字,或者将其进行转换。
使用方式:tr [option]...SET1 [SET2]
常用参数:

参数 说明
-d 删除和 set1 匹配的字符,注意不是全词匹配也不是按字符顺序匹配
-s 去除 set1 指定的在输入文本中连续并重复的字符

col 命令


col 命令用于将 Tab 换成对等数量的空格键,或反转这个操作。
使用方式:col [option]
常用参数:

参数 说明
-x Tab 转换为空格
-h 将空格转换为 Tab(默认选项)

join 命令


join 命令用于将两个文件中包含相同内容的那一行合并在一起。
使用方式:join [option]... file1 file2
常用参数:

参数 说明
-t 指定分隔符,默认为空格
-i 略大小写的差异
-1 指明第一个文件要用哪个字段来对比,默认对比第一个字段
-2 指明第二个文件要用哪个字段来对比,默认对比第一个字段

paste 命令


paste 命令用于在不对比数据的情况下,简单地将多个文件合并一起,以 Tab 隔开。
使用方式:paste [option] file...
常用参数:

参数 说明
-d 指定合并的分隔符,默认为 Tab
-s 不合并到一行,每个文件为一行

小结


上面这些命令不是所有都会经常用到,不过它们确是很实用的,熟练掌握之后,可以减轻很多工作量,比如不停的用鼠标操作在 gedit 里面复制粘贴复制粘贴,将两个文件的内容合并为一个文件,这原本只需要一个命令就能完成。

作业


在不使用上述两个转换工具的情况下,使用前面学过的命令手动完成 dos 文本格式到 UNIX 文本格式的转换。

Windows/dos 与 Linux/UNIX 文本文件一些特殊字符不一致如断行符 Windows 为 CR+LF(\r\n),Linux/UNIX 为 LF(\n)。使用cat -A 文本 可以看到文本中包含的不可见特殊字符。Linux 的 \n 表现出来就是一个 $,而 Windows/dos的表现为 ^M$,可以直接使用dos2unix和unix2dos工具在两种格式之间进行转换,使用 file 命令可以查看文件的具体类型。

参考答案


去掉文件中 ^M 字符,即 \r 即可。

echo 'Hello\r\nLowoL' >file1 | cat -A file1 | tr -d '^M'

注意管道是让上一个命令的 stdout 作为下一个命令的 stdin。

相关文章

网友评论

      本文标题:Linux 学习笔记(十二):文本处理命令

      本文链接:https://www.haomeiwen.com/subject/wgbzeqtx.html