常识
1、关于命令的后台运行
& : 指在后台运行。
nohup : 不挂断的运行。就是指,用nohup运行命令可以使命令永久的执行下去,和用户终端没有关系,例如我们断开SSH连接,关闭xshell都不会影响他的运行。
jobs可以查看现在正在后台运行的命令。
2、在将下载下来的sra文件转换为fastq文件时
要注意有些fastq-dump版本支持的是--split-e,有些fastq-dump版本支持的是--split-3,可以用--help来查看fastq-dump版本里用的是哪种。比如 本来该是--split-e,却输入了--split-3,如下
fastq-dump --gzip --split-3 -O 输出的文件夹路径 XXX.sra
就会报错:unrecognized option: '--split-3'
然后转换之后的文件是XXX.fastq.gz,可以使用zless命令查看
图片.png
可以看到数据格式是4行表示一段序列,每一行都有自己的意义。
Q&A:
1 输出reads_1.fq文件中的所有序列(即第二行):
less reads_1.fq |sed -n '2~4p'
3、数据过滤
数据过滤的作用:
1 去除含接头的reads
2 去除含有N的比例大于5%的reads
3 去除低质量值(比如以Q20为标准)
一般我们的样品送测序公司后,返回有2套数据:rawdata(过滤前)和cleandata(过滤后)。
网友评论