美文网首页
linux 实用命令

linux 实用命令

作者: 一直想要成为大牛的科研狗 | 来源:发表于2020-08-20 16:22 被阅读0次

    持续更新!!!

    #查看文件行数
    wc -l out/14-3-3.hmm.out
    #筛选identity大于75%的序列
    cat blastp.out |awk '$3>75' |cut -f1 |sort -u > blastp_result_id.list
    #过滤筛选得到E-value小于1*10-20,先拿到序列号,hmmsearch结果
    grep -v "#" NBS-ABC.out|awk '($7 + 0) < 1E-20'|cut -f1 -d  " "|sort -u > NBS-ARC_qua_id.txt
    #批量文件使用clustaw2
    echo "1\nWRKY_domain.fa\n2\n1\nWRKY_domain.aln\nWRKY_domain.dnd\nX\n\n\nX\n" |clustalw2
    #muscle 生成phy格式
    muscle -in mouse_J.pro  -physout seqs.phy
    #ClustalW2 生成phy格式###不好用啊
    echo "1\nyour.fa\n2\n9\n1\n4\n\n1\nyour.phy\nyour.dnd\nX\n\nX\n" |clustalw2
    #MAFFT 生成phy格式
    mafft --auto --phylipout --inputorder final.faa > final.phy
    
    comm -12 file1 file2 Print only lines present in both file1 and file2
    comm -3 file1 file2  Print lines in file1 not in file2, and vice versa
    
    #提取某列大于多少的所有行
    cat all_to_Gsoja | awk '$3>80'|sort -u > all_to_Gsoja_list
    #提取某列
    cut -f2###第二列
    
    Linux cut命令用于显示每行从开头算起 num1 到 num2 的文字。
    语法
    cut  [-bn] [file]
    cut [-c] [file]
    cut [-df] [file]
    参数:
        -b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
        -c :以字符为单位进行分割。
        -d :自定义分隔符,默认为制表符。
        -f :与-d一起使用,指定显示哪个区域。
        -n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的
    
    Linux sort命令对文件进行排序
    语法
    sort [-bcdfimMnr][-o<输出文件>][-t<分隔字符>][+<起始栏位>-<结束栏位>][--help][--verison][文件]
    参数:
        -b 忽略每行前面开始出的空格字符。
        -c 检查文件是否已经按照顺序排序。
        -d 排序时,处理英文字母、数字及空格字符外,忽略其他的字符。
        -f 排序时,将小写字母视为大写字母。
        -i 排序时,除了040至176之间的ASCII字符外,忽略其他的字符。
        -m 将几个排序好的文件进行合并。
        -M 将前面3个字母依照月份的缩写进行排序。
        -n 依照数值的大小排序。
        -u 意味着是唯一的(unique),输出的结果是去完重了的。
        -o<输出文件> 将排序后的结果存入指定的文件。
        -r 以相反的顺序来排序。
        -t<分隔字符> 指定排序时所用的栏位分隔字符。
        +<起始栏位>-<结束栏位> 以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。
        --help 显示帮助。
        --version 显示版本信息
    
    Linux grep 命令用于查找文件里符合条件的字符串。
    grep 指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设 grep 指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为 -,则 grep 指令会从标准输入设备读取数据。
    语法
    grep [-abcEFGhHilLnqrsvVwxy][-A<显示列数>][-B<显示列数>][-C<显示列数>][-d<进行动作>][-e<范本样式>][-f<范本文件>][--help][范本样式][文件或目录...]
    参数:
        -a 或 --text : 不要忽略二进制的数据。
        -A<显示行数> 或 --after-context=<显示行数> : 除了显示符合范本样式的那一列之外,并显示该行之后的内容。
        -b 或 --byte-offset : 在显示符合样式的那一行之前,标示出该行第一个字符的编号。
        -B<显示行数> 或 --before-context=<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前的内容。
        -c 或 --count : 计算符合样式的列数。
        -C<显示行数> 或 --context=<显示行数>或-<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前后的内容。
        -d <动作> 或 --directories=<动作> : 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
        -e<范本样式> 或 --regexp=<范本样式> : 指定字符串做为查找文件内容的样式。
        -E 或 --extended-regexp : 将样式为延伸的正则表达式来使用。
        -f<规则文件> 或 --file=<规则文件> : 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
        -F 或 --fixed-regexp : 将样式视为固定字符串的列表。
        -G 或 --basic-regexp : 将样式视为普通的表示法来使用。
        -h 或 --no-filename : 在显示符合样式的那一行之前,不标示该行所属的文件名称。
        -H 或 --with-filename : 在显示符合样式的那一行之前,表示该行所属的文件名称。
        -i 或 --ignore-case : 忽略字符大小写的差别。
        -l 或 --file-with-matches : 列出文件内容符合指定的样式的文件名称。
        -L 或 --files-without-match : 列出文件内容不符合指定的样式的文件名称。
        -n 或 --line-number : 在显示符合样式的那一行之前,标示出该行的列数编号。
        -o 或 --only-matching : 只显示匹配PATTERN 部分。
        -q 或 --quiet或--silent : 不显示任何信息。
        -r 或 --recursive : 此参数的效果和指定"-d recurse"参数相同。
        -s 或 --no-messages : 不显示错误信息。
        -v 或 --revert-match : 显示不包含匹配文本的所有行。
        -V 或 --version : 显示版本信息。
        -w 或 --word-regexp : 只显示全字符合的列。
        -x --line-regexp : 只显示全列符合的列。
        -y : 此参数的效果和指定"-i"参数相同。 
    eg:
    从文件内容查找匹配指定字符串的行:
    $ grep "被查找的字符串" 文件名
    例子:在当前目录里第一级文件夹中寻找包含指定字符串的 .in 文件
    $ grep "thermcontact" /.in
    
    从文件内容查找与正则表达式匹配的行:
    $ grep –e "正则表达式" 文件名
    
    查找时不区分大小写:
    $ grep –i "被查找的字符串" 文件名
    
    查找匹配的行数:
    $ grep -c "被查找的字符串" 文件名
    
    从文件内容查找不匹配指定字符串的行:
    $ grep –v "被查找的字符串" 文件名
    
    从根目录开始查找所有扩展名为 .log 的文本文件,并找出包含 "ERROR" 的行:
    $ find / -type f -name "*.log" | xargs grep "ERROR"
    例子:从当前目录开始查找所有扩展名为 .in 的文本文件,并找出包含 "thermcontact" 的行:
    find . -name "*.in" | xargs grep "thermcontact"
    
    linux find命令
    将目前目录及其子目录下所有延伸档名是 c 的文件列出来。
    $ find . -name "*.c"
    
    将目前目录其其下子目录中所有一般文件列出
    $ find . -type f
    
    将目前目录及其子目录下所有最近 20 天内更新过的文件列出
    $ find . -ctime -20
    
    查找/var/log目录中更改时间在7日以前的普通文件,并在删除之前询问它们:
    $ find /var/log -type f -mtime +7 -ok rm {} \;
    
    查找前目录中文件属主具有读、写权限,并且文件所属组的用户和其他用户具有读权限的文件:
    $ find . -type f -perm 644 -exec ls -l {} \;
    
    为了查找系统中所有文件长度为0的普通文件,并列出它们的完整路径:
    $ find / -type f -size 0 -exec ls -l {} \;
    

    相关文章

      网友评论

          本文标题:linux 实用命令

          本文链接:https://www.haomeiwen.com/subject/wwfejktx.html