美文网首页导航
计算机视觉的"七大金刚"

计算机视觉的"七大金刚"

作者: 小小杨树 | 来源:发表于2021-08-15 06:09 被阅读0次
奥特曼在思考.png

计算机视觉可以分为以下几大方向:

1.图像分类
2.目标检测
3.图像分割
4.风格迁移
5.图像重构
6.超分辨率
7.图像生成

一. 图像分类(Image Classification)

图像分类,也可以称为图像识别,顾名思义,就是辨别图像是什么,或者说图像中的物体属于什么类别。图像分类根据不同分类标准可以划分为很多种子方向。

比如根据类别标签,可以划分为:
二分类问题,正负样本分类;
多分类问题,比如数字识别;
多标签分类,每个类别都包含多种属性的标签,比如对于服饰分类,可以加上衣服颜色、纹理、袖长等标签,输出的不只是单一的类别,还可以包括多个属性。

根据类别数量,还可以分为:
Few-shot learning:即小样本学习,训练集中每个类别数量很少,包括 one-shot 和 zero-shot ;
large-scale learning:大规模样本学习,也是现在主流的分类方法,这也是由于深度学习对数据集的要求。

二. 目标检测(Object Detection)

目标检测通常包含两方面的工作

1. 检测目标
2.识别目标。

目标检测可以分为单物体检测和多物体检测 。如下图所示coco数据集:


coco数据集示例

目标检测领域发展如下
R-CNN 系列,从 R-CNN 到 Fast R-CNN、Faster R-CNN,Mask R-CNN;
YOLO 系列,从 v1 到 2018 年的 v3 现在陆陆续续有非官方发布的V5了
可见此处:经验杂谈——有效避免目标检测中的误检 - 简书 (jianshu.com)

三. 图像分割(Object Segmentation)

图像分割是基于图像检测的,它需要检测到目标物体,然后把物体分割出来。
图像分割可以分为三种:

普通分割:将不同分属于不同物体的像素区域分开,比如前景区域和后景区域的分割;
语义分割:普通分割的基础上,在像素级别上的分类,属于同一类的像素都要被归为一类,比如分割出不同类别的物体;
实例分割:语义分割的基础上,分割出每个实例物体,比如对图片中的多只狗都分割出来,识别出来它们是不同的个体,不仅仅是属于哪个类别。

一个图形分割的例子如下所示,下图就是一个实例分割的例子,用不同的颜色表示不同的实例。


image.png

四. 风格迁移(Style Transfer)

风格迁移是指将一个领域或者几张图片的风格应用到其他领域或者图片上。比如将抽象派的风格应用到写实派的图片上。
一个风格迁移的例子如下, 图 A 是原图,后面的 B-F 五幅图都是根据不同风格得到的结果。


风格迁移

5. 图像重构(Image Reconstruction)

图像重构,也称为图像修复(Image Inpainting), 目的就是修复图像中缺失的地方, 。通常会采用常用的数据集,然后人为制造图片中需要修复的地方。
一个修复的例子如下所示,总共是四张需要修复的图片,例子来自论文"Image Inpainting for Irregular Holes Using Partial Convolutions"。

图像重构

六. 超分辨率(Super-Resolution)

超分辨率是指生成一个比原图分辨率更高、细节更清晰的任务。一个例子如下图所示,图例来自论文"Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network"。 通常超分辨率的模型也可以用于解决图像恢复(image restoration)和修复(inpainting),因为它们都是解决比较关联的问题。
常用的数据集主要是采用现有的数据集,并生成分辨率较低的图片用于模型的训练。


超分辨率

七. 图像生成(Image Synthesis)

图像生成是根据一张图片生成修改部分区域的图片或者是全新的图片的任务。这个应用最近几年快速发展,主要原因也是由于 GANs 是最近几年非常热门的研究方向,而图像生成就是 GANS的一大应用。


图像生成

相关文章

  • 计算机视觉的"七大金刚"

    计算机视觉可以分为以下几大方向: 1.图像分类 2.目标检测 3.图像分割 4.风格迁移 5.图像重构 6.超分辨...

  • 计算机视觉资源库

    Python 计算机视觉 SimpleCV—开源的计算机视觉框架,可以访问如OpenCV等高性能计算机视觉库。使用...

  • 计算机视觉历史回顾与介绍-笔记

    计算机视觉从何而来 由于“眼睛”,推动了物种的进化。由生物视觉系统,从而开始做相关的计算机视觉的研究。 计算机视觉...

  • “罪恶克星”张学友,AI人脸识别新职业

    “人脸识别”技术属于计算机视觉的应用。计算机视觉是指用计算机来模拟人的视觉系统,实现人的视觉功能,以适应、理解外界...

  • AI计算机视觉研究内容浅析

    一、什么是计算机视觉? 计算机视觉,英文Computer Vision,简称CV。计算机视觉是一门研究如何使机...

  • 浅谈计算机视觉与自然语言处理

    原创:杨其泓 1. 计算机视觉 1.1. 什么是计算机视觉 计算机视觉(Computer Vision)是一门研究...

  • 人工智能的五大核心技术

    计算机视觉 计算机视觉是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉技术运用由图像处理操作及其他技术所...

  • Python学习如何用10行代码完成目标检测

    导语 人工智能的一个重要领域是计算机视觉。计算机视觉是计算机和软件系统能够识别和理解图像和场景的科学。计算机视觉还...

  • 【计算机视觉(五)】模板匹配

    前请提要 前三期(【计算机视觉(二)】常用颜色空间及其转换)、【计算机视觉(三)】形态学处理、【计算机视觉(四)】...

  • [转]计算机视觉

    计算机视觉牛人博客和代码汇总(全) 国内外有名的计算机视觉团队汇总 和机器学习和计算机视觉相关的数学 (转载) 【...

网友评论

    本文标题:计算机视觉的"七大金刚"

    本文链接:https://www.haomeiwen.com/subject/xszebltx.html