前文提到Tangram在基于mapping的步骤,有两种方式:
- mode = "cluster":速度快,占用内存少,适用于空转和单细胞数据来自不同样本情况下。
- mode = "cell": 占用内存大,每个cell进行匹配,可以mapping到空转没有抓到的转录本。
由于受限于空间转录组(包括 Visium 和 Slide-seq技术)的分辨度,每个voxel(spot)通常包含多个单细胞,针对这一情况,采用去卷积的方法去推断细胞组成显得尤为重要。
去卷积是分析中亟需的技术,但很难获取到确切的结果。如果你只是想推断两种细胞的空间分布共定位关系,建议用Mapping的方法即可。如果你是想推断细胞间的通讯连接乃至机制,建议使用project_cell_annotations
来在空间上可视化相应的模块(program usage)。以下是细胞去卷积的步骤:
tangram首先需要知道voxel中包含多少细胞,这可以从对应的组织学图片上通过分割得到,squidpy通过两句代码完成:squidpy.im.process
进行平滑处理,squidpy.im.segment
使用watershed算法进行分割。需要关注的是有些空转技术,比如Slide-seq,不能在对应的经测序的切片上进行染色。针对这些数据,我们用粗略的方式估计细胞密度,传入uniform 到density_prior
。最后需要注意的是,我们很难去验证去卷积的结果,因为我们得不到真实的单细胞空间分布情况。
sq.im.process(img=img, layer="image", method="smooth")
sq.im.segment(
img=img,
layer="image_smooth",
method="watershed",
channel=0,
)
显示框选小图的细胞分割情况
比较DAPI染色和Mask的结果确认分割的质量。
inset_y = 1500
inset_x = 1700
inset_sy = 400
inset_sx = 500
fig, axs = plt.subplots(1, 3, figsize=(30, 10))
sc.pl.spatial(
adata_st, color="cluster", alpha=0.7, frameon=False, show=False, ax=axs[0], title=""
)
axs[0].set_title("Clusters", fontdict={"fontsize": 20})
sf = adata_st.uns["spatial"]["V1_Adult_Mouse_Brain_Coronal_Section_2"]["scalefactors"][
"tissue_hires_scalef"
]
rect = mpl.patches.Rectangle(
(inset_y * sf, inset_x * sf),
width=inset_sx * sf,
height=inset_sy * sf,
ec="yellow",
lw=4,
fill=False,
)
axs[0].add_patch(rect)
axs[0].axes.xaxis.label.set_visible(False)
axs[0].axes.yaxis.label.set_visible(False)
axs[1].imshow(
img["image"][inset_y : inset_y + inset_sy, inset_x : inset_x + inset_sx, 0, 0]
/ 65536,
interpolation="none",
)
axs[1].grid(False)
axs[1].set_xticks([])
axs[1].set_yticks([])
axs[1].set_title("DAPI", fontdict={"fontsize": 20})
crop = img["segmented_watershed"][
inset_y : inset_y + inset_sy, inset_x : inset_x + inset_sx
].values.squeeze(-1)
crop = skimage.segmentation.relabel_sequential(crop)[0]
cmap = plt.cm.plasma
cmap.set_under(color="black")
axs[2].imshow(crop, interpolation="none", cmap=cmap, vmin=0.001)
axs[2].grid(False)
axs[2].set_xticks([])
axs[2].set_yticks([])
axs[2].set_title("Nucleous segmentation", fontdict={"fontsize": 20});
接着我们需要去提前图片中分割成的细胞核单元的特征:每个spot下的分割单元(segmentation object)以及分割单元质心对应的坐标。
# define image layer to use for segmentation
features_kwargs = {
"segmentation": {
"label_layer": "segmented_watershed",
"props": ["label", "centroid"],
"channels": [1, 2],
}
}
# calculate segmentation features
sq.im.calculate_image_features(
adata_st,
img,
layer="image",
key_added="image_features",
features_kwargs=features_kwargs,
features="segmentation",
mask_circle=True,
)
计算及显示每个spot下segmentation object的数量
adata_st.obs["cell_count"] = adata_st.obsm["image_features"]["segmentation_label"]
sc.pl.spatial(adata_st, color=["cluster", "cell_count"], frameon=False)
Deconvolution via alignment
tangram进行去卷积的核心原理是限制每个voxel中mapped单细胞表达谱的数量,这是与其他去卷积方法的不同之处。
实现方式是在map_cells_to_space
函数中传入map_cells_to_space
,这将在损失函数中加入过滤步骤,并进行布尔正则化处理,接着在``target_count中传入所有细胞核(segmentation object)的数量,
density_prior```来传入每个voxel中的segmentation object。
ad_map = tg.map_cells_to_space(
adata_sc,
adata_st,
mode="constrained",
target_count=adata_st.obs.cell_count.sum(),
density_prior=np.array(adata_st.obs.cell_count) / adata_st.obs.cell_count.sum(),
num_epochs=1000,
# device="cuda:0",
device='cpu',
)
同前面一样,可以显示不同细胞类型的空间分布。
tg.project_cell_annotations(ad_map, adata_st, annotation="cell_subclass")
annotation_list = list(pd.unique(adata_sc.obs['cell_subclass']))
tg.plot_cell_annotation_sc(adata_st, annotation_list, perc=0.02)
同样可以通过检测test基因判断mapping的情况
ad_ge = tg.project_genes(adata_map=ad_map, adata_sc=adata_sc)
df_all_genes = tg.compare_spatial_geneexp(ad_ge, adata_st, adata_sc)
tg.plot_auc(df_all_genes);
##################################################
接着是核心部分:
在前面去卷积部分中我们的都每个spot中独特segmentation object的数目以及质心坐标。我们在数据框中显示这些关键信息,每一行代表segmentation object (a cell),表格显示每个细胞的unique centroid ID,包含spot ID和数字index。
tg.create_segment_cell_df(adata_st)
adata_st.uns["tangram_cell_segmentation"].head()
使用tangram.count_cell_annotation()
,其利用去卷积的结果来对每个segmentation ID映射相应的细胞类型。
tg.count_cell_annotations(
ad_map,
adata_sc,
adata_st,
annotation="cell_subclass",
)
adata_st.obsm["tangram_ct_count"].head()
将结果提取成新的AnnData
对象
adata_segment = tg.deconvolve_cell_annotations(adata_st)
adata_segment.obs.head()
该AnnData对象不包含细胞数量,只包含细胞类型的注释,即tangram映射的结果,这更方便进行可视化。在下图中你会发现,每个点并不代表spot,而是代表每个segmentation object。
fig, ax = plt.subplots(1, 1, figsize=(20, 20))
sc.pl.spatial(
adata_segment,
color="cluster",
size=0.4,
show=False,
frameon=False,
alpha_img=0.2,
legend_fontsize=20,
ax=ax,
)
网友评论