图像拼接、分割

作者: ichigoi7e | 来源:发表于2017-11-23 15:53 被阅读0次

图像拼接、分割
OpenCV探索之路（二十四）图像拼接和图像融合技术
图像分割
图像分割算法总结
我所了解的图像分割
PIL初探
图像分割
图像分割
图像分割
图像分割

拼接

全局对齐（global alignment）

2007 年 Autostitch，使用一个全局单应性矩阵对齐两幅图像。
单应性矩阵：描述了两个平面间的映射关系。
落地的软件、应用：openCV stitcher、微软 ICE、Photoshop 拼接工具。
要求（局限）：

两张图片近似在一个平面；
两次拍摄的相机光心近乎重合；

解决方法：

用广角镜头，使相机光心重合；
普通相机多次拍摄，合成类似广角镜头的效果。

空域变化绘制（spatiall-varying warping）

2013 年 APAP，划分网格，局部单应性矩阵。
公开了 MATLAB 代码

缝合线主导（seam-driven）

2014 年 parallax-tolerant，网格优化，添加约束项，每个局部单应性矩阵互相独立单独优化，具有更大的自由度。

后两种方案的缺点：

计算速度慢：由一个矩阵扩展为多个矩阵；
更多的超参数：各约束项之间的相对权重需要调整，虽然超参数可以让我们根据实际需求自行调节，但我们还是乐于看到参数自适应选择（不需要调参），鲁棒性好的方法；
内点要求更高：对匹配特征内点的数量和质量要求都更高，最理想情况是：匹配特征内点能较密集的均匀分布在重叠区域。

解决方法：

线特征作为点特征的补充；
自动识别未对齐区域；

深度学习与图像拼接的结合：通过 CNN 做到特征内点密集、均匀分布于重叠区域。但仅目前来看，CNN 在产品落地难度还是非常非常大的，实时检测和拼接基本不做奢望。

分割

传统方案

2000 年之前，阈值法、边界检测法、区域法。

超像素

2000 年左右
将具有相似特征的像素分组，使得图像块包含单个像素不具备的图像内容信息，并提高了后续处理任务的效率。

基于图论：使用带权无向图，像素信息对应顶点属性，像素间的相似性对应边的权值。将图像分割问题转换成图的划分问题，通过对目标函数的最优化求解，完成图像分割过程。
基于聚类，根据图像中的单个像素及像素间的相互信息，如：颜色、亮度、纹理等，利用聚类算法，将具有相近特征的相邻像素聚到同一个图像块。不断迭代修正聚类结果，直至收敛，从而形成图像分割结果。

有监督、弱监督

2010 年左右

基于分类
将图像的分割问题看作是图像单个像素的分类问题，通过从图像中提取像素级特征，使用分类器进行逐像素分类，从而实现图像分割。分类方法是有监督的机器学习算法，需要大量的标注数据作为训练样本，以训练 SVM、LR、NN 等分类器。事实上，这样的像素级的图像标注费时费力，因此样本非常稀少。

QEM：利用了图像各颜色通道之间的关联，具有较好的鲁棒性，算法运行速度较快。
FCN：融合图像局部和全局信息，实现端到端的像素级图像分割。
Zoom-out：利用 CNN 提取图像多级别特征，使用融合特征进行像素分类，实现图像分割。

结合分类和聚类
聚类方法是一种无监督的学习算法，无须标注图像作为训练样本，因此结合二者的优势。

使用聚类算法生成初始化目标候选区域集；
使用分类算法对各区域进行描述、分类；
根据区域分类结果构建全图标注，完成图像分割。

O2P：使用二阶池化方法描述特征，使用线性 SVM 分类，分割效果好，速度较快。
SDS：融合区域前景和最小外接矩形提取特征，使用 CNN 提取图像特征，利用 NMS 提升分割效果。
R-CNN：使用区域 CNN 提取图像特征，定位并分割物体。提出在标注样本稀少的情况下使用深度网络的方法。

未来趋势：

平衡边界贴合度、算法复杂度的矛盾。即：探寻性能良好，算法复杂度低的超像素算法；
基于弱标注信息的语义分割方法。现在主要是像素级的强标注；
针对特定应用场景的图像分割问题。医学、地质、遥感；
交互式图像分割方法。在分割过程中利用少量的用户交互信息，可以有效提升图像分割效果；
针对多维图像的图像分割方法。RGB-D、视频分割。

网友评论

本文标题：图像拼接、分割

本文链接：https://www.haomeiwen.com/subject/ixrzvxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！