美文网首页
转录组分析 1下载文件

转录组分析 1下载文件

作者: 八段锦1134 | 来源:发表于2021-01-07 23:23 被阅读0次

    常识

    1、关于命令的后台运行

    & : 指在后台运行。
    nohup : 不挂断的运行。就是指,用nohup运行命令可以使命令永久的执行下去,和用户终端没有关系,例如我们断开SSH连接,关闭xshell都不会影响他的运行。
    jobs可以查看现在正在后台运行的命令。

    2、在将下载下来的sra文件转换为fastq文件时

    要注意有些fastq-dump版本支持的是--split-e,有些fastq-dump版本支持的是--split-3,可以用--help来查看fastq-dump版本里用的是哪种。比如 本来该是--split-e,却输入了--split-3,如下

    fastq-dump --gzip --split-3 -O 输出的文件夹路径 XXX.sra
    

    就会报错:unrecognized option: '--split-3'
    然后转换之后的文件是XXX.fastq.gz,可以使用zless命令查看


    图片.png

    可以看到数据格式是4行表示一段序列,每一行都有自己的意义。

    Q&A:

    1 输出reads_1.fq文件中的所有序列(即第二行):
    less reads_1.fq |sed -n '2~4p'

    3、数据过滤

    数据过滤的作用:
    1 去除含接头的reads
    2 去除含有N的比例大于5%的reads
    3 去除低质量值(比如以Q20为标准)
    一般我们的样品送测序公司后,返回有2套数据:rawdata(过滤前)和cleandata(过滤后)。

    相关文章

      网友评论

          本文标题:转录组分析 1下载文件

          本文链接:https://www.haomeiwen.com/subject/bjgaoktx.html