1、什么是图像,对图像进行处理是神马操作
一副图像可以定义为二维的函数z = f(x,y),其中x、y是其空间坐标,而其值z的大小就是函数在该点的灰度值。
例图.png
比如我用Matlab打开了一张256x256大小的图片,一张黑白图片,而在计算机中,它的实际数据结构是这样子的
图像的局部矩阵结构.png我特意截取了灰白色和黑色边界的数据,通过数据我们可以看到,图片的大小为256x256,而其边界坐标是纵坐标y(竖直方向)为127-128,灰白色的数值大小为230,黑色为0。每个坐标位置我们称之为一个像素,而对应坐标数值的大小称之为灰度值。这样看起来应该是比较直观的,图像就是二维的数据集合,我们的图像处理就是对这些数值进行转换。说比较难说清楚,让我们做个小变动,我把边界上的一部分为230的值置为0之后会发生什么事情呢?就像下面一样。
边界像素值改动.png
经过这步改动之后我们的图片也随之发生了改变,很明显,置为0值的位置,像素点变成了黑色。
例图2.png
2、数字图像处理、计算机视觉、OpenCV之间的关系
数字图像处理,一般指输入时图像,输出也是图像的处理,包括图像特征的提取,直至各个目标的识别。主要是通过计算机对图像进行滤波和增强、复原、压缩、形态学处理、分割、表示描述以及目标识别的处理方法及技术手段。
计算机视觉的目标是使用计算机来模拟人的视觉,理解图像输入并根据输入进行分析来采取行动,其本身属于人工智能(AI)的一个分支,最终目的是对人进行模仿,已经涉及到理解已识别的目标及具备一定的认知功能。
OpenCV (Open Source Computer Vision Library),直译过来就是计算机开源视觉库,它实现了图像处理和计算机视觉领域的很多通用算法,库本身是采用 C++ 编写的,但是同时也对 Python, Java, C# 等语言提供接口支持。也就是说在Android中也是可以使用的。
3、OpenCV使用的领域
- 人机互动
- 物体识别
- 图像分割
- 人脸识别
- 动作识别
- 运动跟踪
- 机器人
- 运动分析
- 机器视觉
- 结构分析
- 汽车安全驾驶
应用领域是非常广泛的,甚至一些AR/VR也需要用到OpenCV进行计算机视觉处理。
4、具体使用示例
OpenCV现在已经出到OpenCV3了,先跑个Demo看下效果过过瘾,目前的运行环境是VisualStudio2017+OpenCV3,当然也可以在Android环境下使用,但是OpenCV3本身是C++实现,在Android上使用不仅需要真机测试,还需要JNI调用,学习阶段使用起来不太方便。
先来个平滑滤波,具体原理也暂时先不解释,效果上来讲就是对图片进行模糊处理。先贴上代码,核心代码就是blur(),由它进行均值滤波操作。
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
using namespace cv;
int main( )
{
//【1】载入原始图
Mat srcImage = imread("orange.jpg");
//【2】显示原始图
imshow( "均值滤波【原图】", srcImage );
//【3】进行均值滤波操作
Mat dstImage;
blur( srcImage, dstImage, Size(15, 15));
//【4】显示效果图
imshow( "均值滤波【效果图】" ,dstImage );
waitKey( 0 );
}
均值滤波原图.png
均值滤波效果图.png
代码实现起来很简单,这就是OpenCV的强大之处了,图片的加载,显示,以及图片的操作,这些实现的方法都极其简洁。
对于均值滤波背后的算法刚开始讲解起来会比较麻烦一点,因为会涉及到一些卷积、'核'以及线性滤波、非线性滤波,空间滤波以及频域滤波一些概念,这些得慢慢来,后续会尽量讲到的。
网友评论