美文网首页生信笔记生信
【小工具】按比例截取fastq数据量

【小工具】按比例截取fastq数据量

作者: 11的雾 | 来源:发表于2019-05-17 08:47 被阅读0次

生信需求:

你有fastq文件,想按照5%,10%,20%,40%,60%,80%,截取fastq的数据量。

特点与功能:

1,随机截取,不是按照原始fastq中的顺序截取。
2,支持PE,和SE reads,
3,仅支持fastq格式。
4,目前仅支持固定比例。(5%,10%,20%,40%,60%,80%)。

用法:

usage: downsampling.py [-h] [-r1 READ1] [-r2 READ2] [-p PREFIX]

This is description

optional arguments:
  -h, --help            show this help message and exit
  -r1 READ1, --rd1 READ1
                        input read1 file
  -r2 READ2, --rd2 READ2
                        input read2 file
  -p PREFIX, --prefix PREFIX
                        prefix

举例 -p为输出文件的前缀。

python downsampling.py -r1  16E1L1_R1.fastq.gz -r2 16E1L1_R2.fastq.gz  -p 16E1L1

得到如下结果,输出结果的命名为:前缀+ 固定的后缀(xxpct_Rx.fq.gz)。


image.png

相关文章

  • 【小工具】按比例截取fastq数据量

    生信需求: 你有fastq文件,想按照5%,10%,20%,40%,60%,80%,截取fastq的数据量。 特点...

  • 按比例合并两个fastq

    按比例合并两个fastq 代码:https://github.com/levinyi/work/blob/mast...

  • fastq2fasta 转换小脚本

    一个小工具,主要针对 小RNA 数据操作使用,将 fastq reads 转换为 fasta 。

  • python脚本截取fastq序列

    前言   最近在学习单细胞方面的知识,遇到了一个小的需求就是截取需要的fastq序列。先来说一下为什么有这个需求,...

  • 性能测试方法及目标(转载)

    基准测试(Benchmark Testing) 基准测试是基于一定规模的数据量上进行单业务或按实际用户操作同比例组...

  • test

    [TOC] 创建矩阵(采用ndarray对象) 获取矩阵行数列数(二维情况) 矩阵的截取 按行列截取 按条件截取 ...

  • 按比例抽奖

    需求描述 一张Excel表,35000条记录。按其中一个字段地域 可划分为22种类型。 现要求,根据22种地域所占...

  • php substr 截取中文出乱码

    使用 mb_substr 解决即可, mb_substr 按字符来截取而 substr 按字节来截取

  • FFmpeg 视频截取

    参考:YUV处理工具:文件剪切 按帧数截取 从头截取 (前30帧) 中间截取 (30-100帧) 按时间截取

  • 【转录组03】报错分析&数据质控和过滤

    转录组分析总流程 数据质控 背景知识 数据量的统计方式image.png sra转换成fastq 质控 image...

网友评论

    本文标题:【小工具】按比例截取fastq数据量

    本文链接:https://www.haomeiwen.com/subject/huuiaqtx.html