美文网首页单细胞转录组单细胞分析单细胞类型注释
10X细胞类型手动定义||Identifying Cell Ty

10X细胞类型手动定义||Identifying Cell Ty

作者: 周运来就是我 | 来源:发表于2019-10-24 00:15 被阅读0次

    细胞定义我们不再多说,用非监督方法聚类后是得到了细胞群体异质性(分了几个群出来),但是这些群都是什么细胞呢?于是出现了许多细胞注释的工具,如我们介绍的:

    又但是这些大部分是针对人和小鼠的特定器官的,而且算法定义有时候总有些定义不到。所以有点匠人的精神,学学手动定义细胞类型还是很有必要的。本文就是10X官网给出的手动定义细胞类型的操作流程,链接在下面。

    目标:识别数据集中的已知细胞类型(有一些细胞没有定义出来很正常,未定义出来的细胞有时候更值得关注)。

    在 Loupe Cell Browser中,从已知标记(marker)标识细胞类型是简单而快速的。我们有两种方法,首先通过基因搜索,然后导入基因列表。所以前期的找marker的过程,真的是漫长而又迷人啊,别忘了: single cell marker 基因数据库

    特征(基因)搜索

    既然我们在看血细胞样本,我们来试试寻找B细胞。B细胞的两种可靠标志物是CD79a和CD79b。切换到侧栏的Gene/Feature Expression模式,并开始在Feature Search框中输入。这将触发对Cell Ranger运行中使用的引用中编码的所有基因的搜索,或对特征条形码引用文件中指定的任何特征的搜索( Feature Barcode Reference file)。

    一个常见的问题是,如果您将一些数据集与GRCh38参考数据进行比对,而将其他数据集与hg19参考数据进行比对,那么一些基因名称在不同的数据集之间会有所不同。在寻找基因时要记住这一点

    按Tab或Enter将该基因添加到活动特性列表中(Active Feature List),并在数据集上显示该基因的表达水平。


    现在,你应该看到表达B细胞标记的基因整齐地聚集在一个t-SNE簇中。很明显,不同区域的细胞代表B细胞。

    当您向列表中添加多个Gene/Feature时,着色将表示列表中所有特性的表达式级别的组合。以列表中的CD79A和CD79B和“Feature Max”作为选择的属性,plot的颜色表示每个细胞中CD79A和CD79B之间的最大转录计数。在列表中选择一个Gene/Feature将显示该Gene/Feature的表达式级别。最后,将鼠标悬停在某个特征上,就会显示某个基因的信息和垃圾图标;单击info图标将在web browser中加载该基因的Ensembl参考页面(如果适用),单击trash图标将从当前列表中删除该特性。

    Alternate Colorscales and Manual Ranges

    在Loupe Cell Browser 3.1或更高版本中,您可以选择替代色标,并调整色标范围的端点。要访问这些特性,请单击colorscale右侧的palette按钮。

    在这个弹出窗口中,您可以从colorscale下拉菜单中的一个colorscale中进行选择。您也可以通过取消“自动缩放”复选框,输入一个值,点击“更新最小/最大”按钮来手动设置colorscale的最小和最大。当设置手动最小值和最大值时,值超出范围(小于最小值或大于最大值)的条形码将显示为灰色。

    导入和导出Gene/Feature列表

    另一种查找细胞子类型的方法是导入一个CSV文件,其中包含感兴趣的细胞类型的marker。您可以在这里下载这样一个文件:AMLBloodCell.csv。下载完成后,点击当前功能列表右侧的三个点,从下拉菜单中选择“导入列表”。选择刚刚下载的文件。导入之后,您现在应该能够通过从功能列表选择器中进行选择,从五组标记中进行选择。

    要是自己准备的话,这个CSV文件的格式是这样的,注意表头是需要的:

    您可以使用功能列表菜单来创建和导出您自己的标记集,并从您的工作空间中重命名和删除列表。从菜单中选择Export Lists将把数据集中所有当前活动的列表写入CSV文件,您可以将其导入到其他数据集中。要了解更多关于创建特性列表的信息,请访问有关互操作性的文档(documentation on interoperability)。

    最后,我们将使用这个列表和手动选择工具来探索子结构(亚群)。

    寻找亚群

    目标:在更广泛的细胞类型和更大的集群中找到亚群。

    Loupe Cell Browser 允许您通过表达式筛选和手动选择创建自己的细胞亚群。在这里,我们将使用这两种技术来尝试在AML教程数据集中识别B细胞的子结构,并查看是否存在区分这些子群的基因。

    根据表达水平创建亚群

    让我们回到B细胞标记的列表(CD79A/CD79B)。我们之前知道这些细胞在t-SNE投影的一般区域,但是我们想要创造一个确定为CD79+的细胞亚群。为此,我们将使用基因/特征表达面板中的表达过滤器。通过指定条件和数值,并按下Filter按钮,您将突出显示数据集中满足该条件的单元格。下面的视频展示了我们如何选择所有的CD79a/b+细胞:




    过滤之后,系统将提示您将细胞分配到新类别或现有类别中的新集群或现有集群。在category字段中键入“B Cells”以创建一个新类别,在Cluster字段中键入“All Cells”以创建一个新集群。单击Save将CD79+细胞分配给这个新集群。类别侧边栏将重新显示新类别的图例。

    手动选择修改亚群

    单击Split View按钮将显示表达量筛选器从主B细胞集群外部捕获了一些细胞。为了这次练习的目的,让我们从B细胞“所有细胞”组中移除这些细胞。使用工具箱中的Lasso选择工具,通过拖动一个形状来选择主B细胞簇外的所有细胞,如下图所示:





    给它一个名字

    当选择对话框弹出时,选择“B细胞”作为类别,然后按“从B细胞分配”按钮。这将取消所有这些细胞的类型设置,有效地将这些细胞从B细胞类别中移除。单击“拆分视图”按钮两次,以刷新新的B细胞分配。
    通过放大到“All Cells”集群,我们可以在视觉上识别三个、甚至四个不同的子组。让我们重新使用lasso选择工具来创建新的子组,这次在B细胞类别中为细胞分配一个新的集群:





    最后,选择所有三个组,从显著特征比较选择器中选择局部区分选项。这个应该运行得很快。如果您选择与上述演示大致相同的组,那么应该会看到IGLL1驱动一个集群,CD37驱动另一个集群,SSR4驱动第三个最小的集群。看起来B细胞群中有一些子结构值得研究。

    让我们继续研究这个数据集中的B细胞。我们可以使用Loupe Cell Browser 3.1中新增的过滤功能,将这些B细胞进一步细分为未成熟和成熟的B细胞( filtering feature that's new to Loupe Cell Browser 3.1)。

    确定细胞类型

    目的:识别数据集中已知的未成熟和成熟的B细胞类型。

    让我们在识别细胞类型和探索子结构部分的基础上继续工作。我们将使用Loupe Cell Browser 3.1或更高版本中提供的过滤器面板。


    发现B细胞亚型

    在鉴定细胞类型部分,我们用标记基因鉴定了B细胞;在探索子结构部分,我们通过套索进一步在t-SNE空间分割了B细胞。让我们利用TCL1A的存在或不存在,在之前的B细胞群中找到并创建新的未成熟和成熟B细胞群。

    让我们打开右侧面板中的Filters接口并开始构建一个过滤器。首先,我们将添加在探索子结构时创建的所有三个Cluster 。您可以通过单击“Create New Rule”按钮,然后单击“in [cluster name]”添加一个Cluster ,最后输入Cluster 名称“All Cells”。对其他两个Cluster 重复此操作:“Cluster 1”和“Cluster 2”。由于这两个Cluster 名称在多个类别之间共享,所以您可以在Cluster 名称前加上类别名称“B Cells”,或者在下拉菜单中找到出现在集群名称下的属于“B Cells”类别的Cluster 。

    您可能已经注意到,在添加了所有三个Cluster 之后,没有选择任何条形码(barcode)。您可能还注意到,在面板的底部有一个人类可读的过滤器形式,每当进行更改时,它都会更新。它当前应该显示规则集正在过滤所有细胞和Cluster 1和Cluster 2中的条形码。然而,在所有三个(甚至两个)Cluster 中都不存在条形码。相反,我们希望找到所有细胞或Cluster 1或Cluster 2中的条形码。我们可以通过单击此规则集右上角的toggle来完成此任务。您应该立即看到右上角的Cluster 现在用紫色突出显示,这与我们在探索子结构时创建的Cluster 相同。

    接下来,为了找到未成熟的B细胞,我们想要找到这些簇中表达TCL1A的条形码。由于每个规则集被限制为一个布尔操作符,所以我们需要添加一个新的规则集。点击“Add new ruleset”按钮,然后点击“Create new rule”按钮。通过单击“通"Threshold by count”部分中的>按钮,添加一个规则,使计数上的阈值大于一个值。对于这个规则,选择基因TCL1A。(in B Cells: All Cells or in B Cells: Cluster 1 or in B Cells: Cluster 2) and (TCL1A > 0).


    让我们通过点击底部的“Assign 347 barcodes”按钮将这些条形码分配到一个新的类别。将类别命名为“B Cell Subtypes”,集群命名为“Immature”。

    现在,让我们通过修改刚才做的过滤器来找到成熟的B细胞。因为成熟的B细胞不表达TCL1A,所以让我们修改我们创建的现有TCL1A规则,使其改为“TCL1A = 0”,而不是“TCL1A >”。可以通过直接单击大于号(>)并选择equals(=)来实现。你应该看到一个不同的紫色高亮显示的B细胞子集。将这343个条形码分配到相同的类别“B Cell Subtypes”,并将集群命名为“Mature”。


    现在您已经在这个数据集中分割了B细胞,您可以选择在这些子类型之间运行差异分析(differential expression ),就像我们在探索子结构时所做的那样。值得注意的是,B细胞类别的“Cluster 2”(最右下角的Cluster)看起来完全是成熟的B细胞,而其他两个则混合在一起。


    深度过滤

    过滤器允许您创建布尔过滤器与一个层次的嵌套。每个规则集表示由相同逻辑操作符连接的一组规则。逻辑操作符可以在和/或使用规则集右上角的滑块之间切换。
    当第一个规则集有多个规则时,您可以通过单击底部的“Add new ruleset"来添加额外的规则集。规则集彼此独立运行。每个规则集可以有自己的逻辑操作符。

    规则集都由相同的逻辑操作符连接。当有两个以上的规则集时,可以在和/或顶部的下拉菜单之间切换的选项是:

    • 如果所有规则集都为真,则突出显示条形码
    • 如果至少有一个规则集为真,则突出显示条形码的“下列任何一种”(或)

    在底部过滤器的可读形式中,每个规则集都用括号分组。括号内的逻辑运算符必须是相同的运算符。类似地,括号集合(规则集)之间的逻辑运算符必须是相同的运算符。



    Identifying Cell Types

    相关文章

      网友评论

        本文标题:10X细胞类型手动定义||Identifying Cell Ty

        本文链接:https://www.haomeiwen.com/subject/nnklvctx.html