三维PCA
主成分分析算法(PCA)是最常用的线性降维方法。PCA降维为了在尽量保证“信息量不丢失”的情况下,对原始特征进行降维,也就是尽可能将原始特征往具有最大投影信息量的维度上进行投影。将原特征投影到这些维度上,使降维后信息量损失最小。PCA降维结果的可视化不仅可以用二维坐标表示,还可用三维坐标表示,即三维PCA图。
imageTUTU网站工具使用
云图图(www.cloudtutu.com)可以画很多小伙伴问的三维PCA图!!!
操作步骤如下:
①登录网址:https://www.cloudtutu.com/#/index;
(推荐使用360或者谷歌浏览器)
②输入用户名和密码(已经为大家填好了),输入验证码后即可登录,不必注册,直接使用;
③登录后在工具一栏(全部分析)里找到三维PCA,点击进入;
④请按照界面右侧的说明书或者下文进行操作,即可在2分钟内获得一张三维PCA图。
Step 01 上传文件
※目前平台仅支持.txt(制表符分隔)文本文件或者.csv文件的文件上传。(平台可对不规范的数据格式进行部分处理,但还是请您尽量按照示例数据的格式调整数据,以便机器可以识别)
a) 准备一个数据矩阵(如微生物物种丰度表、基因表达量矩阵、代谢物含量表,也可以是测量数据,例如身高、体重、表型等);
b) 表格需要带表头和列名,每一列为样本名,每一行为各种指标数据名,例如OTU,基因ID、身高、代谢物名称等。
Step 02 参数设置
2.1在界面右侧编辑分组信息:需要对所有样品进行分组,本网站支持在线修改分组名称的功能。有在线输入(方式一)和手动粘贴(方式二)两种方式。(绘图前必须检查分组名称)
2.2 方法选择:本平台提供hellinger、normalize、standardize、total、max、freq、range等方法
a) hellinger,hellinger转化,就是总和标准化数据的平方根(default MARGIN=1),hellinger转化后的数据使用欧氏距离函数计算将得到hellinger距离矩阵。
b) normalize,模标准化,将数据除以每行或者每列的平方和的平方根(default MARGIN=1),模标准化后每行、列的平方和为1(向量的模为1),也即在笛卡尔坐标系中到原点的欧氏距离为1,样品分布在一个圆弧上,彼此之间的距离为弦长,因此也称为弦转化。在基于欧氏距离的PCA、RDA中分析群落数据可以将每个样方弦转化可以弥补欧氏距离的缺陷。弦转化后的数据使用欧氏距离函数计算将得到弦距离矩阵。
c) standardize,z-score标准化,最常用的标准化方法之一,将数据减去均值比上标准差(default MARGIN=2),z-score标准化后数据均值为0,方差为1,服从正态总体的数据标准化后服从标准正态分布。z-score标准化可以去除不同环境因子量纲的影响。
d) total,总和标准化,将数据除以该行或者列的总和,也即求相对丰度(default MARGIN=1),总和标准化后数据全部位于0到1之间。
e)max,最大值标准化,将数据除以该行或者列的最大值(defaultMARGIN=2)。若数据非负,最大值标准化后数据全部位于0到1之间。
f) freq,数据矩阵除以行或列的最大值,并乘以非零值的个数
g) range,Min-max标准化,将数据减去该行或者列的最小值,并比上最大值与最小值之差(defaultMARGIN=2),Min-max标准化后的数据全部位于0到1之间。
2.3 颜色选择:按需求自行选择
2.4 元素的大小:显示元素的圆点图形的大小
**Step 03 网页预览 **
点击“运行”开始作图,出图后可选择“网页预览”的方式进行在线查看。预览小工具使用方法如下:
image
Step 04 下载文件
图片确认无误后可点击“下载”保存压缩包查看网页版文件(网页版也可以调整以上细节)。
Step 05 作图后处理
TUTU云平台提供的PDF格式的矢量图,可通过矢量图处理软件进行编辑和调整(如:文字字体,文字大小,图片分辨率等)。
写作建议
XXXX was performed on Tutools platform (https://www.cloudtutu.com), a free online data analysis website.
网友评论