美文网首页走进转录组转录组数据分析转录组分析
转录组--STAR比对(可用于差异分析、可变剪接分析和call_

转录组--STAR比对(可用于差异分析、可变剪接分析和call_

作者: 千万别加香菜 | 来源:发表于2022-07-12 20:02 被阅读0次

    1 建索引

    STAR --runThreadN 6 --runMode genomeGenerate --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --genomeFastaFiles GCF_002742125.1_Oar_rambouillet_v1.0_genomic.fna --sjdbGTFfile GCF_002742125.1_Oar_rambouillet_v1.0_genomic.gtf --sjdbOverhang 149
    
    --runThreadN:线程数。
    --runMode genomeGenerate:构建基因组索引。
    --genomeDir:索引目录。(需提前建好)
    --genomeFastaFiles:基因组文件。
    --sjdbGTFfile:基因组注释文件。
    --sjdbOverhang:reads长度减1
    

    2 比对(若用于GATK,可不排序输出sam文件)

    1)常规比对(一次2个吧, 用于差异分析)

    STAR --runThreadN 10 --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/SRR17709920
    
    --readFilesIn :paired reads文件
    --outSAMtype :表示输出默认排序的bam文件,类似于samtools sort(还有--outSAMtype BAM Unsorted和--outSAMtype BAM Unsorted SortedByCoordinate)
    --outFileNamePrefix :输出文件路径即前缀
    
    1. 2-pass模式(用于RNA数据的GATK--call_snp)
    1.常规比对
    STAR --runThreadN 10 --genomeDir /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/SRR17709920
    
    --readFilesIn :paired reads文件
    --outSAMtype :表示输出默认排序的bam文件,类似于samtools sort(还有--outSAMtype BAM Unsorted和--outSAMtype BAM Unsorted SortedByCoordinate)
    --outFileNamePrefix :输出文件路径即前缀
    
    2.建立索引,--sjdbFileChrStartEnd参数将所有样品的SJ.out.tab文件作为输入的annotated junction进行第二次建index。
    STAR --runThreadN 20 --runMode genomeGenerate --genomeDir ./index --genomeFastaFiles /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR/GCF_002742125.1_Oar_rambouillet_v1.0_genomic.fna --sjdbGTFfile /home/sll/genome-sheep/Oar_rambouillet_v1.0-STAR/GCF_002742125.1_Oar_rambouillet_v1.0_genomic.gtf --sjdbFileChrStartEnd *.out.tab --sjdbOverhang 149
    
    ./index  新建的索引目录 
    
    3.第二次比对,用第二次建立的index再一次对每个样品进行STAR比对
    STAR --runThreadN 10 --genomeDir ./starmap.bam/index --readFilesIn SRR17709920_1.filter.fastq.gz SRR17709920_2.filter.fastq.gz --readFilesCommand gunzip -c --outFileNamePrefix ./starmap.bam/2_pass/SRR17709920_2pass
    
    注:常规的差异分析、可变剪接分析建议使用HISAT2软件,这破软件好烦,如果是要用RNA数据call SNP那就使用它的2-pass模式,毕竟是GATK官网推荐的软件。

    相关文章

      网友评论

        本文标题:转录组--STAR比对(可用于差异分析、可变剪接分析和call_

        本文链接:https://www.haomeiwen.com/subject/jebabrtx.html