欢迎关注Bioinfor 生信云 微信公众号!
我们做完了上游的基础分析之后,接下来就是数据挖掘了。我们先准备数据挖掘的三张表。
表达矩阵(gene_exp)
每一行是一个基因,每一列是一个样本,需要对数据进行标准化。
标准化之前的read count 矩阵,用于差异表达分析
标准化之后的TPM/FPKM 矩阵,用于其他分析(PCA分析、聚类分析等等)

样本信息表(sample_info)
每一行是一个样本,每一列是一个表型特征(光照、地上生物量、茎长等等),可以和基因进行关联分析

基因信息表(gene_info)
每一行是一个基因,每一列是该基因的信息(symbol、KO、GO),基因的信息可以通过eggnog-mapper在线网站注释得到。

准备好这三张表之后,我们就可以去画图啦,下期见。
网友评论