AI计算机视觉研究内容浅析

作者: 花间独酌酒一壶 | 来源:发表于2019-03-12 21:41 被阅读0次

AI计算机视觉研究内容浅析
“黑马”超多维，带给你想要的计算机视觉！
用神经网络深入研究计算机视觉（第1部分）
10个简单易学的AI计算机视觉开源项目，3分钟入门
网易微专业计算机视觉工程师
不得不赞！京东开源FaceX-Zoo，一站式人脸识别研究平台
Double DIP ——一种无监督层图像分割 AI 技术
浅谈计算机视觉与自然语言处理
计算机视觉历史回顾与介绍-笔记
精细图像识别：Destruction and Construct

一、什么是计算机视觉？

计算机视觉，英文Computer Vision，简称CV。计算机视觉是一门研究如何使机器“看”的科学，更进一步来说，就是指用摄像机和电脑代替人眼对目标进行识别、跟踪和测量等。

二、计算机视觉和机器视觉的区别？

事实上，二者经常会被混淆，即便是一些“专家”也没有分清楚。

简单的说，二者最大的区别是技术要求的侧重点不一样，甚至差别很大。机器视觉（MV）主要是侧重于对量的分析，比如通过视觉去测量一个零件的直径，一般来说，对准确度要求很高。而计算机视觉（CV）主要是对质的分析，比如分类识别，这是一个杯子，那是一条狗。或者做身份确认，比如人脸识别，车牌识别。或者做行为分析，比如人员入侵、徘徊、遗留物、人群聚集等。

三、计算机视觉的主要任务是什么？

计算机视觉的主要任务是通过对采集的图片或者视频进行处理以获得相应场景的信息。计算机视觉任务的主要类型有以下几种：

1、物体检测

物体检测是视觉感知的第一步，也是CV的一个重要分支。物体检测的目标，就是用框去标出物体的位置，并给出物体的类别。

物体检测和图像分类不一样，物体检测侧重于物体的搜索，而且物体检测的目标必须要有固定的形状轮廓。图像分类可以是任意的目标，这个目标可能是物体，也可能是一些属性或者场景。

2、物体识别（狭义）

计算机视觉的经典问题便是判断一组图像数据中是否包含某个特定的物体，图像特征或者运动状态。这一问题通常可以通过机器自动解决，但是到目前为止，还没有某个单一的方法能够广泛的对各种情况进行判定：在任意环境中识别任意物体。

现有技术能够也智能欧很好地解决特定目标的识别，比如简单几何图形识别、人脸识别、印刷或手写文件识别。或者车辆识别。而且这些识别需要在特定的环境中，具有指定的光照、背景和目标姿态要求。

3、图像分类

一张图像中是否包含某个物体，对图像进行特征描述是物体分类的主要研究内容。一般来说，物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述，然后使用分类器判断是否存在某类物体。

物体分类问题就是给输入图像分配标签的任务，这是计算机视觉的核心问题之一。这个过程往往与机器学习和深度学习不可分割。

4、物体定位

如果说图像识别解决的是what，那么，物体定位解决的则是where的问题。利用计算机视觉技术找到图像中某一目标物体在图像中的位置，即定位。

目标物体的定位对于计算机视觉在安防、自动驾驶等领域的应用有着至关重要的意义。

5、图像分割

在图像处理过程中，有时会需要对图像进行分割来提取有价值的用于后续处理的部分，例如筛选特征点，或者分割一或多幅图片中含有特定目标的部分等。

图像分割指的是数字图像细分为多个图像子区域（像素的集合，也被成为超像素）的过程。图像分割的目的是简化或者改变图像的表示形式，使得图像更容易理解和分析。更精确地说，图像分割是对图像中的每个像素加标签的一个过程，这一过程使得具有相同标签的像素具有某种共同视觉特性。

“图像语义分割”是一个像素级别的物体识别，即每个像素点都要判断它的类别。它和检测的区别是，物体检测是一个物体级别的，他只需要一个框，去框住物体的位置，而通常分割是比检测更难得问题。

计算机视觉是通过创建人工模型来模拟本由人类执行的视觉任务。其本质是模拟人类的感知与观察的一个过程。这个过程不止识别，而是包含了一系列的过程，并且最终可以在人工系统中被理解和实现的。

四、目前国内“视觉五虎将”都是谁？

目前在国内计算机领域出现了商汤科技、旷世科技、深兰科技、依图科技和云从科技等技术领先的独角兽公司，行业称为“视觉五虎将”。

网友评论

本文标题：AI计算机视觉研究内容浅析

本文链接：https://www.haomeiwen.com/subject/rleopqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

AI计算机视觉研究内容浅析

相关文章