陌生的城市,陌生的宿舍。我坐在陌生的床上,码着字。就在几天前,我还优哉游哉地在熟悉的地方思考着边缘检测的真谛,谁曾想,一个电话,就让我开始体验思念的伤。此时,外头雷声隆隆,雨声沥沥。无事可做,只得对着熟悉的电脑重新思索着我前些日子思考的问题。
边缘检测,听上去那么地简单。但真要重头开始写,却又没那么简单。我的工作,经常需要在较为单一的背景中寻找矩形物体。例如,寻找身份证啦,寻找纸币啦,以及各种各样的银行卡之类的。它们的背景,不能说复杂;他们的边缘,都可以认为是直的。但工作几年下来,似乎最近才有勇气说,这类问题我已经胸有成竹了。因而把一些想法记录下来,以便日后搜寻,也希望能与读者分享。
边缘检测示例1. Less is More
或许我们总觉得,图像的分辨率越高越好。我们的民用相机有很长一段时间都在比拼像素数。这是不科学的。但我今天并不是要科普选择相机还要看什么指标。而是想说,图像分辨率太高对图像处理的影响。其影响就是——
- 慢
- 太清晰了
分辨率高会使算法变慢,这一定很好理解,因此我就不解释了。关键问题是,太清晰了也是错么?是的。因为过分清晰会使纹理太多而影响我们的算法。还记得以前看过几张“怪图”,我带着眼镜看它时,就觉得上面是一些杂乱无章的线条。但脱了眼镜一看,反而清楚了。做图像处理也是一样,当细节太多时,我们会掉进细节里出不来;但是如果我们让图像变模糊、变小:即,使用金字塔下采样算法pyrDown
或者先对图像模糊一下,然后再使用imresize
来缩小——在小尺度下,一些特征反而变得明显了。
因此,如果要搜索高分辨率的图像的前景边缘,我一般会按实际情况,把图片先下采样几次再说。
2. 三个臭皮匠
在小尺度的图像下,我会想办法粗略地寻找前景。一般地,我会希望用Canny
算子将前景的边缘找出来,之后,最外面的边缘所包围的区域便是前景了。再然后,我会用minAreaRect
来把前景的最小外接矩形给找出来。如果前景本身就是一个矩形,那么到这一步,粗略的边缘也就找到了。但问题来了,我一定要保证前景的外边缘是闭合的。有一点点不闭合都不行……那我怎么最大程度地让它闭合呢?
之前,我总有些思维定势似的,拿到一个彩图就想着怎么先把它弄成灰度图。再对灰度图作Canny
变换。我劳心劳力地去研究用怎么的灰度化的方式更好,但往往都是顾此失彼——当对某些情况调好了,对另外一些情况,又不好了……有一天,我突然开窍了,为何一定只对一张灰度图作Canny
呢,我可以对R/G/B通道分别做Canny
呀!然后再把分别Canny
的结果用bitwise_or
合起来不就完了吗?结果,效果接近完美!
3. 整体观
小尺度虽好,但也只能粗略地找到边缘。如果需要精确定位,还是得回到高分辨的图中。但如果边缘周围的纹理比较复杂的话,边缘还是挺难找。我们可以先考虑,如果边缘周围背景就是黑色,前景就是白色时如何搜索这条直线——这很简单,我们隔几个点搜索一下黑色背景和白色前景之间的交界点的位置,然后再对这些交界点作一个拟合即可。
那如果背景是黑色,而前景的纹理比较复杂呢?那我们可以使用一个叫Deriche核的东西来检测交界点的位置。(相当于先模糊,再用[1 0 -1]这样的核来卷积。)使用这样的方法,交界点可以找得比较准确,最后再用某种直线拟合的方法,比如Huber,来拟合直线即可。
那么,如果背景和前景都比较复杂呢?甚至,我们需要找的是拼接的边缘呢(边缘两边都是前景,都有纹理)?那就可以整体地去求解这条直线的位置了。自己定义一个能量函数或者损失函数,并猜测出这条直线方程的若干可能性。计算这若干条直线方程的能量,选择得到最大的能量那条直线即可。
至于能量函数的具体定义方法,请允许我卖个关子吧~关键是想睡觉了……Zzz……
注:本文中所有标记为这样的function
,都是OpenCV中的函数。
网友评论