mahotas进行细胞统计开胃菜

作者: 生信杂谈 | 来源:发表于2017-11-30 09:55 被阅读42次

mahotas进行细胞统计开胃菜
流式图解析
mahotas安装教程
单细胞分析，统计各个cluster的细胞数和细胞比例
人工智能从cell编程开始
单细胞转录组细胞类型注释分析合集
你想了解的国家自然基金单细胞项目统计分析
scanpy不同cluster及细胞类型合并
走向近代—西方的交流与创造
Python 进行词频统计

Python 图像教程

介绍

需要用到的软件

Python 3+
numpy
matplotlib
mahotas
ipython&notebook

第一个项目:计算细胞核

我们的第一个任务是进行细胞核的计算，你可以点击图像进行下载到本地跟着进行运行

dna.jpeg

首先导入包

import numpy as np
import matplotlib.pylab as plt
import mahotas as mh

对于Python，有能够通过包来完成许多工具，而不是一个包。我们用numpy数组进行储存图像，在我们的案例中，其是一个二维数组（高X宽），或者，对于彩色图像，为三维数组（高X宽X3或者高X宽X4，其中3和4分别表示red，green，blue或者red，green，blue，alpha的元组，其中alpha为透明度）
首先我们读取图像进入内存:

dna=mh.imread('dna.jpeg')

玩弄

在交互模式，例如ipython，你可以查看使用如下方法查看图像

plt.imshow(dna)
plt.show()

output_6_0.png

你可能惊讶图片并不像原来的图片是黑色的，原因是plt默认展示的为jet() bar，你可以通过切换colormap来切换成默认的灰度图，例如如下:

plt.imshow(dna)
plt.gray()
plt.show()

output_8_0.png

你还可以探索如下:

print(dna.shape)
print(dna.dtype)
print(dna.max())
print(dna.min())

(1024, 1344)
uint8
252
0

plt.imshow(dna // 2)
plt.show()

output_11_0.png

我们将图片所有性质除以2，然而得到的结果居然一样，实际上plt在展示图片之前会进行对比扩展

一些实际的工作

现在我们开始实际的计算核酸的工作，我们对开篇导入的图片的物体（objects）进行计算

T=mh.thresholding.otsu(dna)
plt.imshow(dna>T)
plt.show()

output_13_0.png

在这里，我们又一次利用了dna是一个numpy数组，并在逻辑运算中使用它（dna> T）的事实。结果是一个布尔值的数组，这个pylab显示为一个黑白图像。
但是看起来不是那么美好，因为图像包含了许多小的物体。这里有两个方法解决它。一个简单的方法是使用Gaussian筛选抚平小的物体

dnaf = mh.gaussian_filter(dna, 8).astype('uint8')
T = mh.thresholding.otsu(dnaf)
plt.imshow(dnaf>T)
plt.show()

output_15_0.png

mh.gaussian_filter接收图像并过滤器的标准偏差(以像素为单位)并返回过滤后的图像，但是一个更好的方法是使用mahotas筛选图像并且计算阈值，使用numpy操作创建的图像，并用plt展示他们，但是所有的工作都是数组完成的，这样的结果会更好。

我们现在进行一些细胞核的merged。最后的计数只是一个额外的函数调用：

labeled,nr_objects=mh.label(dnaf>T)
print(nr_objects)
plt.imshow(labeled)
plt.jet()
plt.show()

output_18_1.png

我们拥有物体的图像为18个，展示的为标记的（labeled）图像，使用jet()进行着色
我们可以探索标记的物体，其是一个整数的数组，它的值是该位置上对象的标签，所以值的范围从0（背景）到nr_objects。

第二个项目:分隔图像

通过第一个项目，我们完成的还是令人满意，但是仍然有一些核酸是黏在一起的，然我们to do better
这里有一个简单的，传统的想法:

平滑图像
寻找区域最大值
使用区域最大值作为watershed的种子

寻找种子

但是且慢，有一些细胞在照片上重叠了，被我们算作一个细胞了。显然是这不科学的，因此我们需要更精确的计算方法。接下来我们要讨论的方法寻找团块的中心点并计算中心点的个数。这里我们假设在灰度图上，团块比较中心的地方比较亮，最亮的地方就是最中心的地方。这个东西叫regional maxima，相当于一片山脉中的最高峰。我们找到这个点之后，进行标亮，并且与原来的灰度图重叠在一起。首先我们进行如下的尝试

#plt.figure(figsize=(15,15))
dnaf=mh.gaussian_filter(dna,8).astype('uint8')
rmax=mh.regmax(dnaf)
plt.imshow(mh.overlay(dna,rmax))
plt.show()

output_20_0.png

mh.overlay()返回一个彩色图像，第一个参数给出灰度级分量，而第二个参数作为红色通道。结果看起来不太好：
稍微摆弄一下后，我们决定用一个更大的sigma尝试相同的想法：

plt.figure(figsize=(15,15))
dnaf=mh.gaussian_filter(dna,15).astype('uint8')
rmax=mh.regmax(dnaf)
plt.imshow(mh.overlay(dna,rmax))
plt.show()

output_22_0.png

看起来好许多，我们可以方便的统计核算数量了

seeds,nr_nuclei=mh.label(rmax)
print(nr_nuclei)

Watershed

我们打算将Watershed应用于阈值图像的距离变换(使用矩阵最大值减去矩阵内所有元素，使得矩阵元素的数值原来大的变小，小的变大,得到下图)：

T=mh.thresholding.otsu(dnaf)
dist =  mh.distance(dnaf>T)
dist =  dist.max()-dist
dist -= dist.min()
dist  = dist/float(dist.ptp())*255
dist  = dist.astype(np.uint8)
plt.imshow(dist)
plt.show()

output_26_0.png

现在，根据矩阵的元素的大小，以之前得到的一堆最高峰（seeds）为核心位置，观察每个核心与邻居核心之间的边界（元素数值的局域极大值），把这个边界标记出来。就得到了核心的区域划分图。

nuclei=mh.cwatershed(dist,seeds)
plt.imshow(nuclei)
plt.show()

output_27_0.png

参考资料:
原文
 使用python做图像处理

mahotas进行细胞统计开胃菜
Python 图像教程介绍需要用到的软件 Python 3+ numpy matplotlib mahotas...
流式图解析
1. 流式细胞术：是基于细胞或颗粒光学散射特点和荧光信号差异对单个细胞或颗粒进行统计分析的一种检测方法。 2. 流...
mahotas安装教程
hi!各位好久不见，小伙伴们的科研道路是否顺利。我的导师告诉我要讲好故事，才能让人觉得生动有趣，所以我今天想用另外...
单细胞分析，统计各个cluster的细胞数和细胞比例
本文引自【小脚本】统计各个cluster的细胞数和细胞比例
人工智能从cell编程开始
cell 意为细胞，模拟人体细胞的行为，进行编程
单细胞转录组细胞类型注释分析合集
SingleR 使用SingleR包进行单细胞类型注释分析 Celaref 使用Celaref包进行单细胞类型注释...
你想了解的国家自然基金单细胞项目统计分析
你想了解的国家自然基金单细胞项目统计分析原创天涯清水单细胞天地前言上次爬取了2009-2019年度单细胞...
scanpy不同cluster及细胞类型合并
在用scanpy进行单细胞分析时往往要对聚类(leiden)后的簇进行细胞类型的标注并生成细胞图谱，但是在通常使用...
走向近代—西方的交流与创造
（在阅读文章之前，提议大家先去看一下开胃菜，在进行细致的阅读https://www.jianshu.com/...
Python 进行词频统计
1. 利用字典map实现 2.利用collections模块中的Counter对象 3. 算法：...

mahotas进行细胞统计开胃菜

Python 图像教程

介绍

需要用到的软件

第一个项目:计算细胞核

玩弄

一些实际的工作

第二个项目:分隔图像

寻找种子

Watershed

相关文章

mahotas进行细胞统计开胃菜

流式图解析

mahotas安装教程

单细胞分析，统计各个cluster的细胞数和细胞比例

人工智能从cell编程开始

单细胞转录组细胞类型注释分析合集

你想了解的国家自然基金单细胞项目统计分析

scanpy不同cluster及细胞类型合并

走向近代—西方的交流与创造

Python 进行词频统计

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

生物信息杂谈

分子模拟

Python

数据可视化

生物信息学与算法