美文网首页
三、数据质控

三、数据质控

作者: 白米饭睡不醒 | 来源:发表于2021-02-24 11:48 被阅读0次

    1.fastq格式介绍

    1.1 1.2 1.3 1.4
    #统计reads_1.fq文件种共有多少条reads
    zless -SN SRR1039510_1.fastq.gz  | wc -l
    
    #.输出reads_1.fq文件中所有的序列ID(即第一行)
    zless -SN SRR1039510_1.fastq.gz  | paste - - - -  | awk  -F  '{print $1}'  | less -S
    
    

    2.数据质控

    2.1 2.2
    # 激活conda环境
    conda activate rnaseq
    
    # 连接数据到自己的文件夹
    ln -s /teach/data/airway/fastq_raw25000/*gz .
    
    # 使用FastQC软件对单个fastq文件进行质量评估,数据放在fqdir路径里,结果输出到qc/文件夹下
    qcdir=~/project/Human-16-Asthma-Trans/data/rawdata/qc
    fqdir=~/project/Human-16-Asthma-Trans/data/rawdata/fastq
    fastqc -t 3 -o $qcdir  $fqdir/SRR1039510_1.fastq.gz
    
    # 多个数据质控
    fastqc -t 10 -o $qcdir $fqdir/SRR*.fastq.gz
    
    #nohup sh qc.sh >qc.log &
    #jobs
    
    # 使用MultiQc整合FastQC结果(将众多zip文件整合在一起)
    multiqc *.zip
    
    

    3.质控报告的理解(html)

    3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20

    相关文章

      网友评论

          本文标题:三、数据质控

          本文链接:https://www.haomeiwen.com/subject/azfdfltx.html