美文网首页
BSA分析(四)测序数据质控过滤

BSA分析(四)测序数据质控过滤

作者: Bioinfor生信云 | 来源:发表于2023-05-20 20:28 被阅读0次

因业务拓展,想组建一个数据分析团队(目前已有RNA-Seq、Chip-Seq、重测序与群体遗传、基因家族、比较基因组、宏基因组、微生物多样性16s/18s/ITS方向专业人员),欢迎有各种数据分析基础的朋友加入我们!
——Bioinfor 生信云

数据质控

原始测序数据下机后,可能会包含低质量、接头等,我们可以使用 fastqc对数据质量进行查看。

fastqc --outdir ./  # 输出目录
--threads 4 \ # 线程数
S1_1.fq.gz S1_2.fq.gz  # 输入文件

结果文件:

  1. 网页版质控报告 *_fastqc.html
  2. 报告对应数据 *_fastqc.zip

数据过滤

使用 fastp 进行低质量数据过滤。

fastp --thread 4 \ # 线程数
-i S1_1.fq.gz \ # 输入数据fq1
-I S1_2.fq.gz \ # 输入数据fq2
-o S1_1_clean.fq.gz \ # 输出数据fq1
-O S1_2_clean.fq.gz \ # 输出数据fq2
-j S1.json \ # json格式结果
-h S1.html \ # 网页版结果
2>S1.log

输出文件:
过滤后的 fq 数据 :clean.fq.gz
网页版结果:
.html

对日志进行汇总统计

# 将json文件列到一个文件里面
ls *.json |awk -F "." '{print $1"\t"$0}' > fastp.json.list

# 汇总统计
Rscript json.R  fastp.json.list fastp.statout

# json.R
library("rjson")

json <- read.delim(input,header = F)

outtab <- data.frame()
for ( i in rownames(json)) {
  name <- json[i,1]
  jfile <- json[i,2]
  res <-as.data.frame(fromJSON(file = jfile)$summary)
  row.names(res) <- name
  res <- round(res,digits = 4)
  outtab <- rbind(outtab, res)
}

options(scipen = 100)
write.table(outtab , file = output, quote = F, sep = "\t", row.names = T, col.names = T,)

相关文章

  • 转录组数据分析

    转录组分析基本流程 总体流程 测序的原始数据下载-----数据的过滤和质控(fastp)----下载参考基因组序列...

  • nanopore测序数据质控

    目前的nanopore测序质量一般,那么测序质量到底如何,则需要进行量化,也就是数据质控分析。数据质控是数据分析中...

  • 主成分分析

    数据过滤质控之后 PCA分析(gcta) 利用R绘图

  • 第2篇:原始数据的质控、比对和过滤

    这部分内容包括对原始测序数据质控,然后比对过滤,这是所有NGS数据处理的上游分析。 ATAC-Seq与其他方法不同...

  • 转录组直播学习笔记:第二天

    数据过滤与质控软件:fastp目的:对测序序列的质量检查 安装软件 安装miniconda, 详见Minicond...

  • 宏基因组分析概述

    测序数据预处理——质控:Trimmomatic 测序数据预处理——质控统计:FastQC 序列组装与基因预测——拼...

  • RNA-Seq data analysis

    数据准备 数据来源 测序下机数据 直接进行质控和后续分析; 已发表数据 以“The PP2A-interactor...

  • 序列组装

    1.利用fastqc对模拟测序的序列进行质控分析 1.1 使用art-illumina模拟测序,生成高通量数据(a...

  • NBIS系列单细胞转录组数据分析实战(二):数据降维可视化

    第二节:数据降维可视化 加载所需的R包和质控过滤后的数据 首先,我们加载分析所需的R包和上一节中质控过滤后的数据集...

  • 转录组分析——四、数据质控

    数据质控:fastqcfastqc软件可以对fastq格式的原始数据进行质量统计,评估测序结果,为下一步修剪过滤提...

网友评论

      本文标题:BSA分析(四)测序数据质控过滤

      本文链接:https://www.haomeiwen.com/subject/btdnjdtx.html