邂逅opencv

作者: 二十四桥客_ | 来源:发表于2016-04-09 08:55 被阅读420次

    初识OpenCV

    OpenCV简介:

    OpenCV (Open Source Computer Version)是一个基于开源的跨平台的计算机视觉库,可以实现图像处理和计算机视觉方面的很多通用算法。

    OpenCV官方主页:http://opencv.org

    OpenCV Github 主页:https://github.com/Itseez/opencv

    OpenCV 开发版 Wiki 主页:http://code.open.org

    Opencv可以解决如下领域问题:人机交互、物体识别 、图像分区 、人脸识别、动作识别、运动追踪、机器人。

    OpenCV常见模块介绍:

    • calib3d ———Calibration (校准)和3D的组合缩写,主要是相机校准和三维重建相关的内容。包括基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等。

    • contrib ——— Contributed / Experimental Stuf 的缩写。该模块包含了一些最近添加的不太稳定的可选功能。如人脸识别,立体匹配,人工视网膜模型等技术。

    • core ——— 核心功能模块,主要包含:Opencv 基本数据结构、动态数据结构、绘图函数、数组操作相关函数、辅助功能与系统函数和宏、与OpenGL的互操作。

    • imgproc ——— Image Process ,图像处理模块。主要包含线性与非线性的图片滤波、图像的集合变换、其他图像变换、直方图相关结构分析和形状描述、运动分析和对象追踪、特征检测、目标检测等内容。

    • features2d ——— Features2D,也就是 Features 2D,即2D 功能框架,包含如下内容: 特征检测和描述 特征检测器通用接口,描述符提取器通用接口 描述符匹配器通用接口 通用描述符匹配器通用接口 关键点绘制函数和匹配功能绘制函数

    • flann 高维的近似快速搜索算法库,主要包含: 快速近似最近邻搜索和聚类

    • gpu ——— 运用GPU 加速的计算机视觉模块

    • highgui ——— 高层 GUI 图形用户界面,包含媒体的输入和输出、视频捕捉、图像和视频的编码解码、图形交互的接口等内容。

    • legacy ——— 一些已经废弃的代码库,保留作为向下兼容使用。

    • ml ——— Machine Learning 机器学习模块,基本上是统计模型和分类算法,包含如下内容:统计模型、一般贝叶斯分类器、K-近邻、支持向量机、决策树、提升、梯度提高树、随机数、超随机数、期望最大化、神经网络、MLData。

    • non free ——— 一些具有专利的算法

    • objdetect ——— 目标检测模块,包含 Cascade Classification (级联分类)和 Latent SVM 这两个部分

    • photo ——— Computational Photograpy,包含图像修复和图像去噪两部分

    • stitching ——— images stitching, 图像拼接模块

    • suppers ——— superResolution, 超分辨率的相关功能模块

    • ts ——— OpenCV 测试相关代码

    • video ——— 视频分析组件

    • Videostab ———视频稳定相关组件

    Opencv 头文件

    opencv.hpp中已经包含了OpenCV各个模块的头文件,,我们在编写core, objdetect, imgproc,photo,vedio,features2d,calib3d,ml,highgui,contrib 等模块应用程序时,原则上仅写上一句#include <opencv2/opencv.hpp> 即可,这样可以精简代码。

    命名规范

    • 类名,类型定义,包括枚举和typedef,混合使用大小写,首字母大写。 如ClassNameTypeName
    • 局部变量混合使用大小写,首字母小写,其名字应该与底层数据类型无关,并且应该反映该变量所代表的事物。如 localVariable
    • 函数名混合使用大小写,首字母大写。如 ChildFunc
    • 对类的多个子程序可见的成员变量名用m_前缀表示 如m_ClassVariable
    • 全局变量名 用g_ 前缀。 如 g_GlobalVariable
    • 具名常量全部大写。 如 CONSTANT
    • 宏全部大写,单词间用分隔符”_” 隔开。 如 SCREEN_WIDTH

    常见的关键字字母组合包括:

    • Max 最大值
    • Min 最小值
    • Init 初始化
    • T(Temp) 临时变量
    • Src 源对象
    • Dst 目的对象

    虽然命名规则在这里,但是我们在应用中切记不要迂腐,不要墨守成规,该变通的时候还可以做适当的变通。

    agrc与argv 认识
    argc 和 argv[] 中的arg 指的是”参数”, 其中,argc为整数,用来统计运行程序时送给main函数的命令行的个数,默认值为1(程序的全路径名)。argv[ ] 表示字符串数组,用来存放指向字符串参数的指针数组,每一个元素指向一个参数。这两个参数在用命令行编译是有效。
    图片的声明,读取和显示

    简单体验

    1.声明一副图像:

     Mat srcImage;
    
    1. 读取图片

       srcImage = imread(“PathOfImage”);
      
    2. 显示图像

       imshow(“Title”,srcImage);
      

    图像的简单处理:

    1. 图像腐蚀:

       Met element = getStructuringElement(MORPH_RECT, Size(15,15)); // 设置参数
      
       erode(srcImage, dstImage, element);  // 进行图像腐蚀
      
    2. 图像模糊:

       blur(srcImage,dstImage,Size(7,7));
      
    3. 边缘检测

      cvtColor(srcImage,garyImage,CV_BG2GRAY);// 将图像转换为 灰度图像
      
      blur(grayImage,edge,Size(3,3));//对灰度图像使用 3* 3 内核来降噪
      
      Canny(edge, edge, 3, 9, 3);   // 进行边缘检测
      

    由视频/相机采集图像

       VideoCaputure capture(“1.avi”);   // 读入视频
    
       // VideoCapture capture(0)  调用摄像头
    
      while(1){
    
          Mat frame;  // 定义Mat变量,用于存储每一帧图像
    
          capture >> frame;  // 读取当前帧
    
          imshow(“读取视频”, frame);  // 显示当前帧
    
           waitKey(30);  // 延迟30ms
    
       }
    

    图像的载入,显示和输出

    Imread 函数

    函数原型为: Mat imread( const String& filename, int flags = IMREAD_COLOR );

    其中第一个参数const String &类型的 filename,填我们需要载入的图片路径。Opencvimread 函数支持如下类型的图像载入。

    • Windows bitmaps - *.bmp, *.dib (always supported)

    • JPEG files - *.jpeg, *.jpg, *.jpe (see the Notes section)

    • JPEG 2000 files - *.jp2 (see the Notes section)

    • Portable Network Graphics - *.png (see the Notes section)

    • Portable image format - *.pbm, *.pgm, *.ppm *.pxm, *.pnm (always supported)

    • Sun rasters - *.sr, *.ras (always supported)

    • TIFF files - *.tiff, *.tif (see the Notes section)
      第二个参数,int 类型的 flags,为载入标识,它指定加载图像的颜色类型,可以看到其默认值为1,所有这个参数可以缺省。如下为

       enum ImreadModes {
           IMREAD_UNCHANGED  = -1,   //这个标识在新版本已被废弃,可以忽略
           IMREAD_GRAYSCALE    = 0,    //将图像转换成为灰度图  
           IMREAD_COLOR             = 1,     //总是将图像转换为彩色再返回
           IMREAD_ANYDEPTH      = 2,    
          //如果 载入图像深度为16位或者32位,就返回对应深度的图像。否则转换为8位图像返回
      };
      

    如果不在上述枚举范围内取值,可以按照如下方式进行:

    • flags > 0 返回一个三通道彩色图像
    • flags = 0 返回灰度图像
    • flags < 0 返回Alpha 通道的加载图像

    imshow函数

    void imshow(const String& winname, InputArray mat);
    第一个参数: const String& 类型的winname,填需要显示的图像标识名称。
    第二个参数:InputArray 类型的 mat, 填需要显示的图像。函数原型中的InputArray可以简单的当做Mat类型即可。
    imshow 函数用于在指定的窗口中显示图像。如果窗口用的而是CV_WINDOW_AUTOSIZE(默认值)标识创建的,那么显示图像的原始大小。否则,将图像以合适窗口缩放。

    • 如果载入图像是8为无符号类型,显示图像原来样子。
    • 如果图像是16位无符号类型或32位整形,用像素数除以256。也就是说,该值范围从[0, 255 * 256]映射到[0,255]。
    • 如果图像是32位浮点数,像素便要乘以255.也就是说该值范围是从[0,1]映射到[0,255]

    namedwindow()函数

    namedWindow 的作用是通过制定窗口的名称,创建一个可以作为图像或者进度条的容器窗口。
    函数原型:

     void namedWindow(const String& winname, int flags = WINDOW_AUTOSIZE);
    

    第一个参数const String &类型的 name,填写被用作窗口的标识符的窗口名称。第二个参数,int类型的flags,窗口的标识,可以填写以下值:

      WINDOW_NORMAL     = 0x00000000,  用户可以改变窗口大小
      WINDOW_AUTOSIZE   = 1, 窗口大小会自动调整,以适应所显示的图像,并且用户不能手动改变窗口大小
      WINDOW_OPENGL     = 0x00001000,  窗口会支持OpenGL
    

    imwrite 函数

    imwrite函数用于将图像保存到制定的文件。图像格式是基于文件扩展名的,可以保存的扩展名和imread中可以读取的图像扩展名一致。

    bool imwrite( const String& filename, InputArray img,
              const std::vector<int>& params = std::vector<int>());
    

    第一个参数,const String & ,类型的filename, 填写需要写入的图像数据。注意,要带上后缀。

    第二个参数,InputArray类型的 img,一般填一个Mat类型的图像数据。

    第三个参数,为特定格式保存的参数编码。
    对于JPEG 格式的图片,这个参数表示从0 到100 的图片质量。默认值为95。
    对于PNG格式的图片,这个参数表示压缩级别从0 到9。 较高意味着更小的压缩尺寸和更长的压缩时间。
    对于 PPM,PGMPBM 格式的图片。这个参数表示二进制格式标识,取值为0或者1,默认值为1.

    相关文章

      网友评论

        本文标题:邂逅opencv

        本文链接:https://www.haomeiwen.com/subject/hpzvlttx.html