美文网首页
用正则表达式,清除文章中多余的换行和空白字符

用正则表达式,清除文章中多余的换行和空白字符

作者: mudssky | 来源:发表于2021-07-05 15:57 被阅读0次

在我们养成一个写文章的好习惯之前,往往格式是一团糟的.

尤其是使用各种富文本格式.

现在我已经认识到富文本格式的坏处了,我写文章,一般都会用纯文本格式,比如markdown.

如果以后写书,需要更丰富的排版的时候,我想我也会选择latex而不是word

写word还不如写html来的爽快.

富文本格式最大的问题在于不适合用git进行版本控制.而且体积也十分庞大.多占用了很多空间.

而且富文本格式里面并不像我们用vscode之类的编辑器编辑文本文件一样,也能显示出空白字符,所以不注意就生产了大量无用的空白字符.

另外富文本的格式太多太乱了,而且又对我们掩盖了这些格式的细节.

这里我翻出我5年前写的word文档,当时我比较喜欢换行,来表达自己奔放的情绪.

但是现在,我认识到了换行越多,信息密度越低的道理,觉得一个空行就够多了.

还有以前格式比较乱,即使是空行的行也有许多没用的空格,增加了文件大小

我把word文档复制到markdown里面就是这副惨状..

1.去除空行中多余的空格

正则中的\s可以匹配空格和换行符.

我们用vscode的查找与替换功能

这里我们匹配大于一个空白字符的空行,然后用换行符替换,这样就去除多余的空格了,一番操作,去掉了50多个空行

^\s{1,}$

2.去除多余的换行符

我们设置最多有连续三个换行,所以我们把大于3个换行符的进行替换

\n{3,}
\n\n\n

换成3个换行符

相关文章

  • 用正则表达式,清除文章中多余的换行和空白字符

    在我们养成一个写文章的好习惯之前,往往格式是一团糟的. 尤其是使用各种富文本格式. 现在我已经认识到富文本格式的坏...

  • iOS 字符串过滤空白字符和换行符

    //去除掉首尾的空白字符和换行字符 // 去掉首尾的空白字符 // 去掉换行符 // originalString...

  • java2018课程 ex1笔记

    1.使用正则表达式去掉回车、换行、空白符号:\r: 匹配一个回车符\n: 换行符匹配;\s:匹配任何空白字符,包括...

  • 正则表达式

    基本单字符 . 代表适配任意单个字符(换行除外) \s 匹配空白字符、空格、制表符和换行符 字符限制 [] 限定某...

  • 过滤空白符和换行符

    //去除掉首尾的空白字符和换行字符NSString *detail = [transPond.detail str...

  • #20 正则表达式删除两端多余空白字符

    完成正则表达式 TRIM_REGX,可以用它来删除一个字符串前后多余的空白字符。 例如: ' ScriptOJ ...

  • 正则表达式

    正则表达式 元字符代码说明.匹配除换行符以外的任意字符\w字母、数字、下划线或汉字\s匹配任意空白符\d匹配数字\...

  • 正则表达式『常用标识符汇总』

    正则表达式 常用的元字符 代码说明.匹配除换行符以外的任意字符\w匹配字母或数字或下划线或汉字\s匹配任意的空白字...

  • re模块

    正则表达式 预定义字符集(可以写在字符集[…]中) . 匹配除换行符“\n”外任意单个字符 \w 单词字符...

  • HTML -- Paragraph

    段落 段落使用 标签表示 标签会移除多余的空白字符(换行或空格),并装换成一个空格 如果要新起一行,使用 标签...

网友评论

      本文标题:用正则表达式,清除文章中多余的换行和空白字符

      本文链接:https://www.haomeiwen.com/subject/zfkiultx.html