1.使用trimmomatic去接头;
2.使用star对参考基因组构建索引(30min);
STAR --runThreadN 8 --runMode genomeGenerate --genomeDir $workingdir \
--genomeFastaFiles $ref --sjdbGTFfile $gtf &
3.使用star将illumina测序数据比对到参考基因组上(1h);
此时得到的bam文件处理后即可用IGV进行可视化,首先对bam文件进行sort并建立索引:
samtools sort -@ 30 $file -o $out
samtools index $file
4.使用featurecounts计算比对到每个基因上的counts,需要传入gtf注释文件;
featureCounts -Q 2 -M --fraction -s 0 -T 10 -p -C -a your.gtf -o $out.featurecounts $bam
5.使用TPM对counts进行归一化处理;
TPM计算脚本见:https://www.jianshu.com/p/d02334a98e0a,需要准备gtf格式的注释文件,counts文件和自己构建的样品分组文件。
6.可使用DEseq2或edgeR进行差异表达基因(DEGs)等分析。
网友评论