美文网首页
2020-11-06 小智讲堂之正则表达式(笔记)

2020-11-06 小智讲堂之正则表达式(笔记)

作者: 云若蓝 | 来源:发表于2020-11-06 11:21 被阅读0次

    本文源自小智师弟教我的几个替换代码

    引用:

    https://docs.microsoft.com/zh-cn/dotnet/standard/base-types/regular-expression-language-quick-reference?redirectedfrom=MSDN

    https://deerchao.cn/tutorials/regex/regex.htm

    开始:

    先附上本次使用的字符,使用的软件是notepad++。

    https://deerchao.cn/tutorials/regex/regex.htm https://deerchao.cn/tutorials/regex/regex.htm https://docs.microsoft.com/zh-cn/dotnet/standard/base-types/regular-expression-language-quick-reference?redirectedfrom=MSDN

    目的是为了将单个文件内的多序列合并为一条序列,删除下图箭头指向的行(序列标题)。

    具体步骤:

    查找目标\r    #windows中换行符有\r和\n两种,linux中只有\n一种

    替换为    #(空),目的是消除所有\r

    查找目标\n>.*\n

    替换为    #(空)

    即可消除文件中所有序列的标题,仅留全文件中第一条序列标题。

    #若想删除所有标题,可查找目标>.*\n

    另:小智师弟小讲堂的附赠部分

    每80字符分割序列

    查找目标([acgt]{80})    #[acgt]指的是匹配中括号中a或c或g或t字符,{80}表示匹配数量为80个

    替换为\1\n    #\1表示替换为()内的内容,\n表示换行

    以序列部分标题作为新标题 结果

    查找目标>(.*)-2\n

    替换为\1\n

    同样是删除所有文件中的序列标题

    查找目标[^acgt]{1,}

    注:在标题中出现atcg的话就会保留标题中的atcg,从而影响结果。

    通过文件查找批量替换多个文件中的序列标题

    注:在标题中出现atcg的话就会保留标题中的atcg,从而影响结果。

    最后

    请谨慎使用。

    立夏快乐!

    相关文章

      网友评论

          本文标题:2020-11-06 小智讲堂之正则表达式(笔记)

          本文链接:https://www.haomeiwen.com/subject/zhzzvktx.html