美文网首页
RNASeq实战练习-数据过滤与质控

RNASeq实战练习-数据过滤与质控

作者: 小小白的jotter | 来源:发表于2021-08-13 17:50 被阅读0次

    trim-galore过滤低质量的reads

    转录组分析 | 使用trim-galore去除低质量的reads和adaptor

    #进入analysis目录
    cd /home/jiamj/analysis/
    
    # 创建clean文件夹
    mkdir clean
    
    # 进入存放转录组数据的rnadata目录
    cd /home/jiamj/analysis/rnadata
    
    # 批量过滤
    for i in 39 40 41 42 43 44
    do 
    nohup trim_galore --phred33 -q 30 --stringency 1 --length 50 --paired SRR75089${i}_1.fastq.gz SRR75089${i}_2.fastq.gz -o /home/jiamj/analysis/clean &
    done
    
    image-20210802171043768

    FastQC

    FastQC是一款基于Java的软件,它可以快速地对测序数据进行质量评估

    参数 作用
    -o --outdir FastQC生成的报告文件的储存路径,生成的报告的文件名是根据输入来定的
    -t --threads 选择程序运行的线程数
    # 激活 rnaseq 环境
    conda activate rnaseq
    
    #进入analysis目录
    cd /home/jiamj/analysis
    
    # 在analysis目录下建一个存放QC文件的文件夹
    mkdir QC
    
    # 打开过滤后数据所在的文件夹
    cd /home/jiamj/analysis/clean
    
    # fastqc分析
    fastqc -o /home/jiamj/analysis/QC *gz
    

    MultiQC

    MultiQC可以将FastQC产生的多个输出报告整合为一个,方便查看

    multiqc dir/ -o output -n multiQC

    参数 作用
    dir 分析整合目录
    -o 整合后的输出目录
    -n 输入文件名字,默认multiqc_report
    # 退回上一个目录,即analysis目录
    cd ..
    # 整合fastqc结果
    multiqc QC/ -o QC/ -n multiQC
    

    相关文章

      网友评论

          本文标题:RNASeq实战练习-数据过滤与质控

          本文链接:https://www.haomeiwen.com/subject/sukjbltx.html