R语言 -- 统计 Fastq 文件前十万条 reads 的长度

R语言 -- 统计 Fastq 文件前十万条 reads 的长度

作者: 生信摆渡 | 来源:发表于2020-08-28 11:46 被阅读0次

R语言 -- 统计 Fastq 文件前十万条 reads 的长度
如何统计测序文件的reads长度分布
2019-05-04
【生信技能树】fa和fq格式文件的shell小练习
Linux生信练习2--fastq/fasta
flash双端reads拼接成一条
统计fastq长度分布
统计fastq文件read长度及read平均长度
python处理fastq文件序列
python生信小练习（三）

由于fastqc的结果 reads 长度分布有点奇怪，所以想看看是原始 Fastq 文件的问题还是 Fastqc 处理的问题。取了前十万条 reads 来进行统计作图。

Fastq files

R 脚本在 QC 文件夹里面

R script

setwd("/sibcb2/bioinformatics2/wangjiahao/LungCGI/Fastq/QC")

Ns = list.files("..", ".gz", full.names = TRUE)

pdf(file = "Reads_length_counts.pdf")

    for(i in 1:length(Ns)){

        fastq = Ns[i]
        cat("Processing", fastq, "\n")
        system(paste("zcat", fastq, "| head -100000 > temp"))
        seqs = readLines("temp")[seq(2, 400000, 4)]
        counts = table(nchar(seqs))

        plot(counts, col = "red", type = "l", main = strsplit(fastq, "[./]")[[1]][2], xlab = "Length", ylab = "Counts")
        file.remove("temp")
    }
dev.off()

Run

Result

刚开始没想到联合 Linux 的 zcat 和 head 命令，而是直接 readLines 把Fastq 文件读完，很显然这样太慢了，经过改进快了几十倍我giao

果然是 Fastq 文件的 reads 本身就有问题

相关文章

R语言 -- 统计 Fastq 文件前十万条 reads 的长度
由于fastqc的结果 reads 长度分布有点奇怪，所以想看看是原始 Fastq 文件的问题还是 Fastqc ...
如何统计测序文件的reads长度分布
记录今天学会的一个小知识：统计测序文件的reads长度分布由于某些原因，需要统计reads长度分布对建库方法进行...
2019-05-04
fasta和fastq格式文件的shell小练习 1 统计reads_1.fq 文件中共有多少条序列信息 2 输出...
【生信技能树】fa和fq格式文件的shell小练习
【生信技能树】fasta和fastq格式文件的shell小练习 1)统计reads_1.fq 文件中共有多少条序列...
Linux生信练习2--fastq/fasta
作业原文:fasta和fastq格式文件的shell小练习 | 生信菜鸟团原始数据准备 Q1 统计reads_1...
flash双端reads拼接成一条
命令: 生成以下文件 *extendedFrags.fastq为拼接后的reads文件 .histogram为拼接...
统计fastq长度分布
截取长度列j是线程数 f 是长度所在列得到一列长度数然后在R 中运行画最后得出一个分布图参考
统计fastq文件read长度及read平均长度
转录组分析使用stringtie定量后，如果使用DESeq2进行下游分析，需要使用prepDE.py生成read ...
python处理fastq文件序列
1.序列长度分布统计 2.FASTQ转换成FASTA 3.统计各种碱基个数及GC%
python生信小练习（三）
生信菜鸟团的编程练习：对FASTQ的操作 5,3段截掉几个碱基序列长度分布统计 FASTQ 转换成 FASTA...

网友评论

测序基础

本文标题：R语言 -- 统计 Fastq 文件前十万条 reads 的长度

本文链接：https://www.haomeiwen.com/subject/spxlsktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

测序基础

关于我们|服务条款|联系我们|R语言 -- 统计 Fastq 文件前十万条 reads 的长度|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！