美文网首页AI
视觉领域的机器学习简介

视觉领域的机器学习简介

作者: 豪哥的世界 | 来源:发表于2019-02-14 18:16 被阅读25次

    视觉领域的机器学习简介

    有一个问题

    机器是如何通过自学来变得更加智能的呢?

    答案是机器和人类一样,需要通过不断的学习和所获得的经验来提升自己的智力,它们通过神经网络来不断学习。

    人类的大脑是最聪明的机器,大脑里面有数十亿的神经元,通过这些神经元同步接收信息,并根据其类型分类,区分数据元素,然后寻找并存储归档了这个数据。这是一个对我们大脑是如何工作的简化描述。

    人类的大脑.png
    人看到车.png

    而神经网络和大脑一样, 它们收到输入的信息,处理信息,并传递输出信息。为了能够处理信息它必须经过充分的训练。

    神经网络.png

    神经网络的架构是多层设计的,每层接收输入并产生输出,每个中间层使用前一层的输出作为输入,所有这些不同层的组成我们叫做深度神经网络或DNN(Deep Neural Network)。 而DNN的图像应用就叫做卷积神经网络或CNN(Convolutional Neural Network),它既适用于2D图像,也适用于3D图像。

    多层神经网络.png

    那么开发人员是如何训练深度神经网络的呢?训练的目标又是什么呢?

    训练神经网络.png

    神经网络需要大量的经验数据,比如大量已经分好类的图像,以便能够最终对新图像进行分类。图像数据库提供了数据,软件库提供了处理数据的框架。谷歌公司已经开源了自家的机器学习框架,TensorFlow。TensorFlow被用于谷歌公司的很多产品比如油管,比如Google Photo等谷歌自家的产品。很多大公司(例如IBM,微软,Facebook)也投入了数十亿美元来研究该项技术。

    近些年来,研究者已经在对象识别领域取得了成功。在机器人和生物识别领域, 在自动驾驶中的预警系统中,在手写识别和自动翻译工具等场景中都已经有成功应用。


    对象识别.png
    应用1-机器人抓取.png
    应用2-自动驾驶.png
    应用3-手写识别.png 应用4-自动翻译app.png

    如今,工具技术已经成熟,不仅是大公司比如谷歌或者微软能够基于神经网络技术来做产品和服务,小公司也可以。

    那么,这背后的技术原理是什么呢?神经网络带来的实际价值是什么呢?

    为什么我们需要机器来看图像?因为图像传感器的数量比人口数量还多,人们不可能通过物理上去检查传感器获得的每个图片或视频。


    人和传感器.png

    在互联网上搜索特定的图像,我们会使用搜索引擎的图片搜索,比如使用谷歌的图片搜索引擎,而该图片搜索引擎的工作原理与算法是基于22层深度卷积神经网络的,我们称之为称为Inception。这个神经网络对图片对象的分类结果远远好于手工分类。

    inception.png

    神经网络的下一代技术将是生成对抗网络,简称GAN(generative adversarial networks)。它是两个神经网络的组合,一个用来生成训练集,一个用来生成其他数据集。

    GAN.png

    最后,机器真的可以自学:)

    本文翻译自一下链接。

    https://dwz.cn/oI1rSs8b

    相关文章

      网友评论

        本文标题:视觉领域的机器学习简介

        本文链接:https://www.haomeiwen.com/subject/tqfyeqtx.html