美文网首页生信软件和工具
Notepad++ 正则表达式 | fasta 文件

Notepad++ 正则表达式 | fasta 文件

作者: 新_世_界 | 来源:发表于2021-07-23 15:42 被阅读0次

Notepad++ 常用的处理文本的正则表达式

1. 在每行开头加16进制颜色

查找:^
替换:#FFB6C1

2. 合并多行代码为1行

查找:[\r\n\t]
替换:

3. 去除特定字符冒号:之前的所有字符(不包括>)。

原始文件:

>TraesCS6B02G079100:TraesCS6B02G079100.1
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460:TraesCS3D02G280460.1
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC
    1. 方法一
      查找:.*\:
      替换: >
    1. 方法二
      查找:([A-Za-z0-9]*)(\:)([A-Za-z0-9]*\.[0-9])
      替换:\3

☝注意:其实方法二更加精确!

替换后:

>TraesCS6B02G079100.1
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460.1
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC

4. 删除特定字符: 之后的所有字符(不包括:)

    1. 方法一
      查找:\:.*$
      替换: >
    1. 方法二
      查找:([A-Za-z0-9]*)(\:)([A-Za-z0-9]*\.[0-9])
      替换:\1

替换后:

>TraesCS6B02G079100
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC

相关文章

网友评论

    本文标题:Notepad++ 正则表达式 | fasta 文件

    本文链接:https://www.haomeiwen.com/subject/tnxpmltx.html