美文网首页
使用Cytobank的SPADE分析方法

使用Cytobank的SPADE分析方法

作者: 裁尘的人儿 | 来源:发表于2020-09-03 07:59 被阅读0次

    Cytobank是一个云平台,可以分析流式数据,尤其是针对高维流式数据(参数可以高达30个以上)的SPADE与viSNE分析方法。其账号有三种,分别是Basic,Premium,Enterprise。Basic不能用于SPADE与viSNE分析,而Premium可以使用这两种方法。(注:Cytobank平台不支持IE,我开始使用的是Chrome,但有时候不太稳定,后来改用了Firefox,运行比较流畅。)


    Cytobank提供viSNE、SPADE和FlowSOM等无监督聚类算法,与传统通过手动分析方法相比,降低了主观因素以及某些可能无法检测到的非预期影响,增大了未知表型的发现机会。


    image.png

    Cytobank平台的聚类、降维和可视化工具充分利用可伸缩的云计算,在不占用计算机的情况下快速进行大量分析。软件即时自动将全部工作结果保存在云端,以确保不会丢失数据、工作不致中断。软件本机算法实现而且完全支持RESTful API接口,简化流程的同时还可与信息学工作流集成。

    image

    现在以此文献(Behbehani, G. K., et al. (2012). "Single-cell mass cytometry adapted to measurements of the cell cycle." Cytometry A 81(7): 552-566.)为例演示一下如何使用,这篇文献中的Figure6使用的是SPADE方法,就用这个数据文件,数据文件参见http://reports.cytobank.org/104/v6,下载后的流式数据文件是ACS格式的,这是一种新型的流式数据文件,可以参见以前的笔记,此文件可以被普通的压缩文件解压(例如好压,Bandizip等)。解压后的Figure6数据文件参见此路径(Single_Cell_Mass_Cytometry_Adapted_to_Measurements_of_the_Cell_Cycle_Cytometry_June_2012\experiments\Figures 6&7\fcs_files)下的流式文件,就是常见的fcs格式流式文件(NormalMarrow-1+2.fcs),此文件可以在Cytobank平台中进行分析。

    先在Cytobank平台申请一个Premium账号,在登录界面的右上角的"Log In",单击其中的"Premium"进行申请。单击"New Experiment"这个绿色的按钮,新建一个实验,输入相关的实验信息,星号是必填项目。信息填写完毕,最下面的灰色按钮会变绿,单击"Create Experiment",之后会出现上传文件的对话框,上传文件之后,打开SPADE选项卡下的"New SPADE Analysis",输入输信息,先对细胞种群进行门设置(圈定的细胞指标是DAN(Ir intercalator)与cell length,可以参见文献的附加信息(Supplemental Figure 2)),门设置之后,按照文献中的给出的分类依据(有25个表现标志)进行SPADE分析,分析完后会收到Email,这个过程要几分钟。分析结果如下所示:

    image.png

    分析结果的界面由以下几个部分构成,分别为:

    (一)SPADE Analysis Controls由三个部分构成:

    ①Compensation:在分析过程中选择补偿(这个补偿不知道与传统的流式中的补偿是不是一回事,文献中给出的数据没有)

    ②Target Number of Clusters:选择SPADE算法进行聚类的个数。输入你想要分类的数目,最终的分析结果与这个数目接近,默认的是200(200通常是9到15个表面标记的选择,而文献中的给出的250,因为其表现标志为25个)。

    ③Downsampled Events Target:SPADE算法在进行聚类之前,先对FCS文件进行密度采样。可以指定一个百分比(默认的是10),或者是输入一个绝对数目。特定的值是指每个文件(例如"absolute number: 1000"是指每个文件中的1000个事件,"percent: 10%"是指每个文件中采样的数目是10%。注意:这种密度采样之后,然后会用50000个事件进行随机聚类。

    (二)SPADE Setup由三个部分构成,如下所示:

    ①Populations:选择进行SPADE聚类的细胞种群。通常划定的种群是活的单细胞(例如文献中划定细胞的方法是用cell length与DNA来划定单细胞的),虽然用户有时候也会选定一个特定的细胞群(有的时候只是想看T细胞亚群的一些特定种类,例如只看CD3+)

    ②Clustering Channels:可以选择一个或者是多个通常用于聚类。通常用户选择一些细胞表面标记,即那些经常用于手动门设置的一些细胞表面标记。

    ③Fold-Change Groups:如果用户有两个或更多的文件时,SPADE会对每个指标的倍性变化(Fold-Change)进行计算,设置SPADE组。如果有多个时间点或者多种条件,这就是一种设置组别的方式。

    注:Fold-Change即倍性变化,这是一种用于描述两个用于相比的对象数量差异的方法。例如,第一个样本和第二个样本的量是50/10,那么FC(Ratio)就是5,反之就是0.2。用这种方法分析微阵列的数据可以说明:1)从基因表达的绝对值而来的表达变化是有意义的;2)这种方法可以说明基因表达变化是否显著;3)可以利用这种模型用于有效数据的筛选。

    (三)Actions是指对分析的结果进行处理,例如对分析进行重命名,下载分析结果的PDF格式,下载分析数据等,很好理解。

    (四)Events Plot是各个事件的二维图。

    (五)SPADE Tree Rendering

    (1) Metric:使用节点颜色颜色的统计度量,有三个,分别为median, fold, coe

    (2) Scale Range:两个选项,分别为Local与Global,Local将会用当前显示的文件来决定颜色比例尺(color scale)的最小与最大值值。Global会使用分析过程中所有文件来进行颜色比例尺最小与最大值的设置(这个是节点颜色,与后面的节点大小不同)。

    (3)Scale Symmetry:对称将会使颜色标记在0附近(如果要观察fold-changes时,配色方案中心会有一个黑色,这非常有用,例如当设置为Asymmetric,即不对称,这时发现配色比例尺的数值是从小到大,而当设置为Symmetric,对即对称时,配色比例尺的数值则是从负值到最大,并且其相加为0,这两个端点关于0点对称)。

    (4) Color Scheme是配色方案。

    (5) Background Color:背景颜色。

    (6) Node Size:Min/Max Size控制节点的最大与最小的直径。

    (7) Scale Range:两个选项,分别为Local与Global,Local将会用当前显示的文件来决定颜色比例尺(color scale)的最小与最大值值。Global会使用分析过程中所有文件来进行颜色比例尺最小与最大值的设置(这个是节点直径,与前面的节点颜色不同)。

    <wbr>

    (8) Annotation这个是标注,Add Bubble与Remove Selected Bubble(s)的功能是往树状图上添加或者是删除一个泡泡。 用泡泡可以划分相似的节点。

    (9) Merging可以收缩相似的节点,可以将这些相似的节点看成一个来处理。

    (10) Rotation用来旋转选中的节点,按z键也可以。

    (11) Save Tree:可视化的结果会每10秒保存一次。

    (12) Reset可以将SPADE树恢复到原始状态。

    (六)右边的SPADE Tree是分析的树状结果。

    (七)Node Attributes是节点属性,单击节点后,可以显示相关信息。

    相关文章

      网友评论

          本文标题:使用Cytobank的SPADE分析方法

          本文链接:https://www.haomeiwen.com/subject/kezqsktx.html