1.fastq格式介绍
1.1
1.2
1.3
1.4
#统计reads_1.fq文件种共有多少条reads
zless -SN SRR1039510_1.fastq.gz | wc -l
#.输出reads_1.fq文件中所有的序列ID(即第一行)
zless -SN SRR1039510_1.fastq.gz | paste - - - - | awk -F '{print $1}' | less -S
2.数据质控
2.1
2.2
# 激活conda环境
conda activate rnaseq
# 连接数据到自己的文件夹
ln -s /teach/data/airway/fastq_raw25000/*gz .
# 使用FastQC软件对单个fastq文件进行质量评估,数据放在fqdir路径里,结果输出到qc/文件夹下
qcdir=~/project/Human-16-Asthma-Trans/data/rawdata/qc
fqdir=~/project/Human-16-Asthma-Trans/data/rawdata/fastq
fastqc -t 3 -o $qcdir $fqdir/SRR1039510_1.fastq.gz
# 多个数据质控
fastqc -t 10 -o $qcdir $fqdir/SRR*.fastq.gz
#nohup sh qc.sh >qc.log &
#jobs
# 使用MultiQc整合FastQC结果(将众多zip文件整合在一起)
multiqc *.zip
3.质控报告的理解(html)
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
3.14
3.15
3.16
3.17
3.18
3.19
3.20
网友评论