1 建索引
STAR --runThreadN 6 --runMode genomeGenerate --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --genomeFastaFiles GCF_002742125.1_Oar_rambouillet_v1.0_genomic.fna --sjdbGTFfile GCF_002742125.1_Oar_rambouillet_v1.0_genomic.gtf --sjdbOverhang 149
--runThreadN:线程数。
--runMode genomeGenerate:构建基因组索引。
--genomeDir:索引目录。(需提前建好)
--genomeFastaFiles:基因组文件。
--sjdbGTFfile:基因组注释文件。
--sjdbOverhang:reads长度减1
2 比对(若用于GATK,可不排序输出sam文件)
1)常规比对(一次2个吧, 用于差异分析)
STAR --runThreadN 10 --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/SRR17709920
--readFilesIn :paired reads文件
--outSAMtype :表示输出默认排序的bam文件,类似于samtools sort(还有--outSAMtype BAM Unsorted和--outSAMtype BAM Unsorted SortedByCoordinate)
--outFileNamePrefix :输出文件路径即前缀
- 2-pass模式(用于RNA数据的GATK--call_snp)
1.常规比对
STAR --runThreadN 10 --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/SRR17709920
--readFilesIn :paired reads文件
--outSAMtype :表示输出默认排序的bam文件,类似于samtools sort(还有--outSAMtype BAM Unsorted和--outSAMtype BAM Unsorted SortedByCoordinate)
--outFileNamePrefix :输出文件路径即前缀
2.建立索引,--sjdbFileChrStartEnd参数将所有样品的SJ.out.tab文件作为输入的annotated junction进行第二次建index。
STAR --runThreadN 20 --runMode genomeGenerate --genomeDir ./index --genomeFastaFiles /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR/GCF_002742125.1_Oar_rambouillet_v1.0_genomic.fna --sjdbGTFfile /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR/GCF_002742125.1_Oar_rambouillet_v1.0_genomic.gtf --sjdbFileChrStartEnd *.out.tab --sjdbOverhang 149
./index 新建的索引目录
3.第二次比对,用第二次建立的index再一次对每个样品进行STAR比对
STAR --runThreadN 10 --genomeDir ./starmap.bam/index --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/2_pass/SRR17709920_2pass
网友评论