美文网首页生信笔记
按比例合并两个fastq

按比例合并两个fastq

作者: 11的雾 | 来源:发表于2018-05-11 10:18 被阅读102次
    按比例合并两个fastq

    代码:https://github.com/levinyi/work/blob/master/script/merge_two_fastq/mix_two_fastq_together.py
    使用场景:

    introduction:

    闲来无事,想讲两个物种的fastq按照不同比列合并在一起,再去比对,看比对率如何。

    需求:

    按比例将fastq,按一定数据量随机混合。需要设定一个比列:10:90,需要设定一个总数据量(总共产生多少条reads)

    方法:

    fastq1 + fastq2
    根据设定的模拟总量和比列,先随机出reads序列的位置,和数量。并取出来合并即可。
    比如:需要混合成500条,按照10:90的比例,则需要50条fastq1,和90条fastq2,那么就从fastq1中的总reads数中随机挑选出50条,如果不够则可以重复某条read,同理

    用法:
    python  mix_two_fastq_together.py -a CL100000999_L02_1_1.fq.gz  -b CL100000100_L02_5_1.fq.gz  -c 10:90   -d   5000000   -o CL100000444_L02_1_1.fq.gz
    
    说明:

    脚本用到了python的biopython包去读取fastq格式文件。
    脚本用到了python的threading多线程去处理fastq,节省了读取两个fastq的时间。
    脚本用到了python 的argparse管理参数。

    更新:

    20180529:修改了多线程写入时逻辑,避免了写入时的乱码。


    任何细节都可在评论区留言。
    有生之年,会持续更新。

    相关文章

      网友评论

        本文标题:按比例合并两个fastq

        本文链接:https://www.haomeiwen.com/subject/vuaxdftx.html