Bowtie2

作者: 重拾生活信心 | 来源:发表于2022-11-02 15:40 被阅读0次

1.下载参考基因组的fasta文件(ref.fa)(UCSC, NCBI, Ensembl.)
2.bowtie2-build ref.fa XXX
3.output:6个文件
XXX.1.bt2 , XXX.2.bt2 , XXX.3.bt2 , XXX .4.bt2 , XXX.rev.1.bt2 , XXX.rev.2.bt2
4.比对(-x 6个index文件的位置/前缀)
bowtie2 -x XXX -U R1.fq.gz -S output.sam
bowtie2 -x XXX -1 R1.fq.gz -2 R2.fq.gz -S output.sam
5.转bam
samtools view -bS output.sam > output.bam
samtools sort output.bam -o output.sorted.bam

The bowtie2-build indexer
bowtie2比对软件的安装及参数详解 - 简书 (jianshu.com)

Installation

Installation

conda install bowtie2

Usage

bowtie2-build [options]* <reference_in> <bt2_base>

bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> | -U <r> | --interleaved <i> | --sra-acc <acc> | b <bam>} -S [<sam>]

-x  由bowtie2-build所生成的索引文件的前缀,需要指定路径及其共用文件名
-1  使用trimmomatic质控后与read2配对(paired)的read1。可以为多个文件,并用逗号分开;多个文件必须和 -2 <m2> 中制定的文件一一对应。
-2  使用trimmomatic质控后与read1配对的read2
-U  使用trimmomatic质控后未配对(unpaired)的reads。可以为多个文件,并用逗号分开,测序文件中的reads的长度可以不一样。
-S  所生成的SAM格式的文件前缀。默认是输入到标准输出。
#-p/--threads NTHREADS         设置线程数. Default: 1 
bowtie2-inspect [options]* <bt2_base>

Index zone by BenLangmead

index

Bowtie2 Usage

可选参数

输入参数
-q                输入的文件为FASTQ格式文件,此项为默认值
-f                输入的文件为FASTA格式文件
-5/--trim5 <int>  剪掉5'端<int>长度的碱基,再用于比对。(default: 0)
-3/--trim3 <int>  剪掉3'端<int>长度的碱基,再用于比对。(default: 0).
--phred33         输入的碱基质量等于ASCII+33
Paired-end 参数
--no-mixed       默认设置下, 一对reads不能成对比对到参考序列上, 则单独对每个read进行比对. 该选项则阻止此行为.
--no-discordant  默认设置下, 一对reads不能和谐比对(concordant alignment,即满足-I, -X, --fr/--rf/--ff的条件)到参考序列上, 则搜寻其不和谐比对(disconcordant alignment, 即两条reads都能独一无二地比对到参考序列上, 但是不满足-I,-X,--fr/--rf/--ff的条件). 该选项阻止此行为.
–end-to-end模式下的预设参数
--end-to-end 比对是将整个read和参考序列进行比对. 该模式--ma的值为0. 该模式为默认模式, --local模式冲突.
--local 该模式下对read进行局部比对, 从而, read两端的一些碱基不比对,从而使比对得分满足要求. 该模式下 –ma默认为2.
--very-fast Same as: -D 5 -R 1 -N 0 -L 22 -i S,0,2.50 
--fast Same as: -D 10 -R 2 -N 0 -L 22 -i S,0,2.50 
--sensitive Same as: -D 15 -R 2 -N 0 -L 22 -i S,1,1.15 (default in --end-to-end mode) 
--very-sensitive Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50
报告参数
-k   默认设置下, bowtie2搜索出了一个read不同的比对结果, 并报告其中最好的比对结果(如果好几个最好的比对结果得分一致, 则随机挑选出其中一个). 而在该模式下, bowtie2最多搜索出一个read <int>个比对结果, 并将这些结果按得分降序报告出来.
-a   和-k参数一样, 不过不限制搜索的结果数目. 并将所有的比对结果都按降序报告出来. 此参数和-k参数冲突. 值得注意的是: 如果基因组含有很多重复序列时, 该参数会导致程序运行极其缓慢.
Sam 参数
--no-unal 不记录没比对上的reads.
--no-hd 不记录SAM header lines (以@开头).
--no-sq 不记录@SQ的SAM header lines.
--rg-id <text> 设定read group Id到<text>.
--rg <text> 增加<text>作为一行@RG.
输出参数

-t/--time  --un <path>        将unpaired reads写入到<path>.
--no-unal                     不能map到GENOME的reads,不保留sam记录
--un-conc <path>              不能map到GENOME的reads,fasta格式.
--un-conc-gz <path>           不能map到GENOME的reads,fasta格式, gzip压缩.
--al-conc <path>              能map到GENOME的reads,fasta格式.
--al-conc-gz <path>           能map到GENOME的reads,fasta格式, gzip压缩.
-p/--threads NTHREADS         设置线程数. Default: 1 

作者:husy_
链接:https://www.jianshu.com/p/f84ffba2ec1e
来源:简书
#官网示例
bowtie2 -x lambda_virus -U BT2_HOME/example/reads/reads_1.fq -S eg1.sam
# paired-end example:
bowtie2 -x $BT2_HOME/example/index/lambda_virus -1 _1.fq -2 _2.fq -S eg2.sam
#Use samtools view to convert the SAM file into a BAM file. BAM is the binary format corresponding to the SAM text format. Run:
samtools view -bS eg2.sam > eg2.bam
#Use samtools sort to convert the BAM file to a sorted BAM file.
samtools sort eg2.bam -o eg2.sorted.bam
#We now have a sorted BAM file called eg2.sorted.bam. Sorted BAM is a useful format because the alignments are (a) compressed, which is convenient for long-term storage, and (b) sorted, which is conveneint for variant discovery. 
#To generate variant calls in VCF format, run:
bcftools mpileup -f $BT2_HOME/example/reference/lambda_virus.fa eg2.sorted.bam | bcftools view -Ov - > eg2.raw.bcf
Then to view the variants, run:
bcftools view eg2.raw.bcf
conda activate 
bowtie2-build hg38.fa hg38 

bowtie2 -p 10 -x /data/ref/bowtie2/mm10/mm10 -1 input_1.fq -2 input_2.fq | samtools sort -O bam -@ 10 -o - > output.bam
$bowtie2 -x bowtie_build_index/mm10 -U ATAC1014_gDNA.fastq.gz -p 20 -S mm10.sam

2021-04-22 bam文件中提取比对(mapped)或未比对上(unmapped)reads - 简书 (jianshu.com)

相关文章

网友评论

    本文标题:Bowtie2

    本文链接:https://www.haomeiwen.com/subject/attvartx.html