使用 DESeq2 进行差异基因分析,输入数据为 gene count 矩阵文件和样品分组信息表。
差异基因分析
# 上一步得到的unigenens.count格式转matrix
sed '1s/ˆName\t//' unigenens.count > unigenens.count.matrix
# 差异表达分析(DESeq2)
perl run_DE_analysis.pl \
--matrix unigenens.count.matrix \ # 输入,count表格
--method DESeq2 \ # 差异分析方法DESeq2/edgeR
--samples_file sample.txt \ # 样品分组信息表
--contrasts contrasts.txt \ # 进行差异分析的组别
--output DE_out # 输出目录
输出结果:unigenens.count.matrix.A_vs_C.DESeq2.DE_results
可基于FDR 和 Foldchange 进行差异物种筛选。
常用的筛选标准:FDR < 0.05 && |log2(FC)|>1
富集分析
得到差异基因分析结果后,可以根据设置的差异基因标准对结果进行提取,并进行 GO 和 KEGG 富集分析。
# A vs C组差异基因进行筛选
# 标准为|log2FC| >1 && FDR <0.05
# 准备 eggnong注释结果表格
# unigene.annotations
Rscript enrich_analysis.R \
./unigenens.count.matrix.A_vs_C.DESeq2.DE_results \ #输入DE_result
./unigene.annotations \ # 输入,eggnong表格
./unigenens.count.enrich #输出前缀
网友评论