美文网首页
利用QTL-seq软件进行BSA定位分析

利用QTL-seq软件进行BSA定位分析

作者: 挖泥种地 | 来源:发表于2023-11-14 18:09 被阅读0次

           最近逛Github,发现一个新出的BSA自动化流程,就叫QTL-seq,看起来还蛮简单方便的,所以搞了一下试试。

           BSA原理就不多说了,在实际操作中,高、低池子至少得两个,然后就是可以选择测还是不测亲本。这套流程是需要亲本测序数据的,还有一些流程是不需要的,例如DeepBSA、QTLseqr等,所以根据自己试验经费来定就好。个人觉得测一下亲本多不了几个钱,可以测了,还可以搞搞重测序分析嘛。

            安装挺简单的,我就喜欢用conda,这个流程又支持conda,所以,上吧

               conda install -c bioconda qtlseq

            完事就安装完毕了,这个流程里面包含了BWA、samtools、BCFtools、Snpeff、Trimmomatic等软件,还有一些python依赖库用于绘图什么的,反正都可以用上面那个命令安装完。

            使用命令很简单,就一行

    qtlseq 

    usage: qtlseq -r <FASTA> -p <BAM|FASTQ> -b1 <BAM|FASTQ>

                  -b2 <BAM|FASTQ> -n1 <INT> -n2 <INT> -o <OUT_DIR>

                  [-F <INT>] [-T] [-e <DATABASE>] [--species <NAME>]

            这玩意需要准备的数据有几个,第一部分是两个亲本的测序数据,使用的是参数-p输入 两个亲本就输入两次-p

    -p P1_1.fq,P1_2.fq

    -p P2_1.fq,P2_2.fq

            第二部分是两个池的数据,

     -b1 bulk1_1.fq,bulk1_2.fq,

     -b2 bulk2_1.fq,bulk2_1.fq,

          测序数据准备完了,剩下就是一些细节参数,比如每个池子里面的样本数

    -b1 int

    -b2 int

        能用的线程数

    -t cpus

          这软件有个特殊的功能,似乎是有人搞了些验证过的snp,用于过滤,目前支持Arabidopsis, Cucumber, Maize, Rapeseed,Rice, Tobacco, Tomato, Wheat, and Yeast等物种,可以增加snp的准确性吧。

    qtlseq -r reference.fasta \

          -p parent.1.fastq,parent.2.fastq \

          -b1 bulk_1.1.fastq,bulk_1.2.fastq \

          -b2 bulk_2.1.fastq,bulk_2.2.fastq \

          -n1 20 \

          -n2 20 \

          -t 48 \

          -o example_dir

        然后个人试用的话,感觉还是太慢了,测序数据清理用的Trimmomatic慢出天际,比对走的是bwa流程,其实讲究加速的话,可以先用fastp-----bwa-mem2-------sambamba流程先建立好所有的去重的bam文件,然后再把bam文件进行输入,速度快得多,所以我个人更喜欢如下这样:

    qtlseq -r reference.fasta \

          -p parent_1.bam \

          -p parent_2.bam \

          -b1 bulk_1.bam \

         -b2 bulk_2.bam \

           -n1  20  \

          -n2 20 \

           -t 48 \

          -o example_dir

    最后输出的文件夹里面包含了各种中间内容:

    ├── 10_ref

    │  ├── reference.fasta

    │  ├── reference.fasta.amb

    │  ├── reference.fasta.ann

    │  ├── reference.fasta.bwt

    │  ├── reference.fasta.fai

    │  ├── reference.fasta.pac

    │  └── reference.fasta.sa

    ├── 20_bam

    │  ├── bulk1.filt.bam

    │  ├── bulk1.filt.bam.bai

    │  ├── bulk2.filt.bam

    │  ├── bulk2.filt.bam.bai

    │  ├── parent.filt.bam

    │  └── parent.filt.bam.bai

    ├── 30_vcf

    │  ├── qtlseq.vcf.gz

    │  └── qtlseq.vcf.gz.tbi

    ├── 40_qtlseq

    │  ├── bulk1_SNPindex.png

    │  ├── bulk2_SNPindex.png

    │  ├── delta_SNPindex.png

    │  ├── sliding_window.tsv

    │  ├── sliding_window.p95.tsv

    │  ├── sliding_window.p99.tsv

    │  ├── np_index.tsv

    │  ├── snp_index.p95.tsv

    │  └── snp_index.p99.tsv

    └── log

      ├── bcftools.log

      ├── bgzip.log

      ├── bwa.log

      ├── samtools.log

      └── tabix.log

    还有图,看起来还不错。

    相关文章

      网友评论

          本文标题:利用QTL-seq软件进行BSA定位分析

          本文链接:https://www.haomeiwen.com/subject/spvjwdtx.html