成品图:
5555.png核心要点:
左边和上面的分组以及最主要的核心数据
所需要的数据:
原始数据(属水平的相对丰度表)
111.png
目的:
1.把最右边的内容改为只留目水平的名字(p__)
2.计算出每一行的和后按照和排序
3.选取排名前一百的内容保留
4.新建行分组和列分组表格
其中,1.和4.在R中完成,其余在excel完成
列分组:
2222.png
行分组:
3333.png
细节:
行列分组在R中都必须是数据框,且行名为对应的数据,行内容为想要的分组。
热图代码:
mat用于绘图的矩阵数据;
color绘图的填充颜色;
kmeans_k进行kmeans聚类时规定k的值;
breaks绘图颜色分为多少个,如为NA则自动计算;
border_color格子边界的颜色;
cellwidth和cellheight为格子的宽和高;
scale定义数据是否要按照行或列进行中心化和标准化;
cluster_rows和cluster_cols定义行或列是否进行聚类;
clustering_distance_rows和clustering_distance_cols定义行或列进行聚类的算法;
clustering_method定义聚类方法,参数与hclust一致;
cutree_rows和cutree_cols定义根据层次聚类将行或列分为几组;
treeheight_row和treeheight_col定义行和列聚类树的高度,默认为50points;
legend定义是否显示图例;
legend_breaks定义图例的颜色分为多少块;
legend_labels定义legend_breaks分块后每块的标签;
annotation_row和annotation_col定义在行或列的左边或上边是否添加特异性的行来对样品或基因进行分组,输入格式为数据框;
annotation_colors定义annotation所添加的行或列的填充颜色;
annotation_legend定义是否显示annotation的图例;
annotation_names_row和annotation_names_col定义是否显示行或列annotation的名字;
drop_levels定义图例中是否显示没使用的level;
show_rownames和show_colnames是否显示行名和列名;
main为图像的主标题;
fontsize图像使用的基本字体大小;
fontsize_row和fontsize_col分别特异性的定义行和列所使用的字体大小;
display_numbers定义图像的格子中是否还包含输入数据的数值;
number_format定义格子中数值的显示格式;
number_color定义格子总数值的显示颜色;
fontsize_number定义格子总数值的字体大小;
gaps_row和gaps_col根据指定的向量向特定的行或列之间添加gap用以区分;
labels_row和labels_col通过自定义的行或列的名称代替数据的行名和列名;
filename定义图像保存路径;
width和height定义输出图像的宽和高;
silent不生成图像。
网友评论