美文网首页走进转录组转录组数据分析转录组分析
转录组--STAR比对(可用于差异分析、可变剪接分析和call_

转录组--STAR比对(可用于差异分析、可变剪接分析和call_

作者: 千万别加香菜 | 来源:发表于2022-07-12 20:02 被阅读0次

1 建索引

STAR --runThreadN 6 --runMode genomeGenerate --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --genomeFastaFiles GCF_002742125.1_Oar_rambouillet_v1.0_genomic.fna --sjdbGTFfile GCF_002742125.1_Oar_rambouillet_v1.0_genomic.gtf --sjdbOverhang 149

--runThreadN:线程数。
--runMode genomeGenerate:构建基因组索引。
--genomeDir:索引目录。(需提前建好)
--genomeFastaFiles:基因组文件。
--sjdbGTFfile:基因组注释文件。
--sjdbOverhang:reads长度减1

2 比对(若用于GATK,可不排序输出sam文件)

1)常规比对(一次2个吧, 用于差异分析)

STAR --runThreadN 10 --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/SRR17709920

--readFilesIn :paired reads文件
--outSAMtype :表示输出默认排序的bam文件,类似于samtools sort(还有--outSAMtype BAM Unsorted和--outSAMtype BAM Unsorted SortedByCoordinate)
--outFileNamePrefix :输出文件路径即前缀
  1. 2-pass模式(用于RNA数据的GATK--call_snp)
1.常规比对
STAR --runThreadN 10 --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/SRR17709920

--readFilesIn :paired reads文件
--outSAMtype :表示输出默认排序的bam文件,类似于samtools sort(还有--outSAMtype BAM Unsorted和--outSAMtype BAM Unsorted SortedByCoordinate)
--outFileNamePrefix :输出文件路径即前缀

2.建立索引,--sjdbFileChrStartEnd参数将所有样品的SJ.out.tab文件作为输入的annotated junction进行第二次建index。
STAR --runThreadN 20 --runMode genomeGenerate --genomeDir ./index --genomeFastaFiles /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR/GCF_002742125.1_Oar_rambouillet_v1.0_genomic.fna --sjdbGTFfile /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR/GCF_002742125.1_Oar_rambouillet_v1.0_genomic.gtf --sjdbFileChrStartEnd *.out.tab --sjdbOverhang 149

./index  新建的索引目录 

3.第二次比对,用第二次建立的index再一次对每个样品进行STAR比对
STAR --runThreadN 10 --genomeDir ./starmap.bam/index --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/2_pass/SRR17709920_2pass
注:常规的差异分析、可变剪接分析建议使用HISAT2软件,这破软件好烦,如果是要用RNA数据call SNP那就使用它的2-pass模式,毕竟是GATK官网推荐的软件。

相关文章

网友评论

    本文标题:转录组--STAR比对(可用于差异分析、可变剪接分析和call_

    本文链接:https://www.haomeiwen.com/subject/jebabrtx.html