美文网首页🍊码农16S和宏基因组
用bowtie2去除fastq文件中的rRNA

用bowtie2去除fastq文件中的rRNA

作者: 547可是贼帅的547 | 来源:发表于2018-05-31 21:41 被阅读24次

    一、在NCBI上下载rRNA的fasta序列,用于建立索引

    1.参考:https://ucdavis-bioinformatics-training.github.io/2017-June-RNA-Seq-Workshop/wednesday/contamination.html

    2.下载步骤

    2.1 打开NCBI,select “Taxonomy” and search for “Homo sapiens“

    2.2 点击 Homo sapiens

    2.3 再点一次

    2.4 右边表格Click on the “Subtree links” for Nucleotide:

    2.5 左边选择rRNA

    2.6 下载FASTA 数据

    注意:选择显示两百个,让所有记录都放在一页,以便下载全部的条目

    另存为:

    hg38_rRNA.fasta

    二、bowtie2建立rRNA索引

    1.解压 hg38_rRNA.fa.gz

    2. 建立索引(index)命令:bowtie2-build hg38_rRNA.fa hg38_rRNA

    三、利用bowtie2去除rRNA

    1.针对单端测序文件(single-end)

    命令: bowtie2 -x ~/RNASEQ/index/rRNA_index/hg38_rRNA --un-gz ${i}_IP_rmrRNA.fastq.gz -U ${i}_IP.read1_Clean.fastq.gz -p 8 -S ${i}_rRNA.sam; rm ${i}_rRNA.sam

    2.针对双端测序文件(paired-end)

    命令:bowtie2 -x ~/RNASEQ/index/rRNA_index/hg38_rRNA --un-conc-gz ${i}_input_rmrRNA.fastq.gz (会生成.1、.2后缀的两个双端文件,就是去除了rRNA的fastq) -1 ${i}_in.read1_Clean.fastq.gz -2 ${i}_in.read2_Clean.fastq.gz -p 8 -S ${i}_rRNA.sam; rm ${i}_rRNA.sam; 

    相关文章

      网友评论

        本文标题:用bowtie2去除fastq文件中的rRNA

        本文链接:https://www.haomeiwen.com/subject/ljjcsftx.html