美文网首页LinuxCHIP分析
数据分析2-.sra数据拆分与过滤

数据分析2-.sra数据拆分与过滤

作者: 王铄_d468 | 来源:发表于2021-01-19 14:30 被阅读0次

1.拆分

>fastq-dump --gzip --split-3 SRR6449842

2.fastqc质量检测

参考:
https://zhuanlan.zhihu.com/p/20731723

fastqc -o [输出目录] -t [线程数] SRR2050895.fastq.gz

3.过滤

3.1对于双端测序不知道接头序列

fastp --detect_adapter_for_pe -w 8 -i SRR6449842_1.fastq.gz -I SRR6449842_2.fastq.gz -o clean_SRR6449842_1.fastq.gz -O clean_SRR6449842_2.fastq.gz -j SRR6449842_report.json -h SRR6449842_report.html

3.2对于单端测序不知道接头序列

fastp  -w 16 -i SRR2050895.fastq.gz -o clean_SRR2050895.fastq.gz  -j SRR2050895_report.json -h SRR2050895_report.html

输出结果为:

Detecting adapter sequence for read1... GTGTAAGCATCTGGGTAGTCTGAGTAGCGTCGTGGTATTCCTGAAAGGCCCAGGAAATGT Read1 before filtering: 

total reads: 45230766 

total bases: 2236673891 

Q20 bases: 2219017453(99.2106%) 

Q30 bases: 2172754983(97.1422%) 

 Read1 after filtering:

 total reads: 45099144 

total bases: 2229459599 

Q20 bases: 2211862439(99.2107%) 

Q30 bases: 2165728977(97.1414%) 

 Filtering result: 

reads passed filter: 45099144 

reads failed due to low quality: 352 

reads failed due to too many N: 64 

reads failed due to too short: 131206 

reads with adapter trimmed: 206061

bases trimmed due to adapters: 7694138 

 Duplication rate (may be overestimated since this is SE data): 57.3777% 

 JSON report: SRR2050895_report.json 

HTML report: SRR2050895_report.html 

 fastp -w 16 -i SRR2050895.fastq.gz -o clean_SRR2050895.fastq.gz -j SRR2050895_report.json -h SRR2050895_report.html 

fastp v0.20.0, time used: 226 seconds

再次使用fastqc进行质控,发现前11个碱基的GC含量有问题

无所谓了,今天2021年1月20日先把剩余的.fq下载下来。

相关文章

  • Tableau 数据处理之快速数据拆分

    Tableau 数据处理之快速数据拆分 当我们用 Tableau 分析数据的时候,有时候会涉及到对数据的拆分,比如...

  • 数据分析的三大思路 2018-02-08

    数据分析的三大思路 1. 数据分析的基本步骤 数据需求业务含义?—— 分析计划——指标拆分——数据发现——商...

  • miRNA分析-比对(二)

    本文简单阐述miRNA分析中,如何对其数据进行比对 早先简单介绍如何对miRNA数据进行过滤miRNA分析--数据...

  • 2-指标预测(指标波动分析)

    需求:分析xx指标下降的原因 --对数据进行数据源拆分,渠道拆分,用户属性拆分。。。 总结起来的套路是什么呢? 指...

  • 前嗅ForeSpider脚本教程:数据过滤脚本

    数据过滤脚本与数据抽取脚本并列的脚本,它的作用是对抽取的数据进行过滤。 注意:一旦有了数据过滤脚本则数据抽取脚本将...

  • react 组件嵌套的使用

    组件嵌套 内层组件使用外部组件的数据 注意组件的拆分,分析数据的传入类型

  • Flink 数据统计 举个栗子

    一、统计流程 image.png 所有流计算统计的流程都是: 1、接入数据源 2、进行多次数据转换操作(过滤、拆分...

  • 主成分分析

    数据过滤质控之后 PCA分析(gcta) 利用R绘图

  • 数据分析入门篇(一)

    甘轻语的学习笔记 什么是数据分析? 数据分析可以拆分为两个词语,数据和分析。数据是一种度量,具备客观性,不因人的意...

  • 数据分析方法

    数据分析基本思路 数据分析基本思路为5步,首先要挖掘业务含义、制定分析计划、从分析计划中拆分出需要的数据、再根据数...

网友评论

    本文标题:数据分析2-.sra数据拆分与过滤

    本文链接:https://www.haomeiwen.com/subject/frjkzktx.html