美文网首页职业副业历史解谜圣经故事
人工智能00001 深度学习与图像识别书评01 机器视觉在行业中

人工智能00001 深度学习与图像识别书评01 机器视觉在行业中

作者: 良友知音 | 来源:发表于2023-09-11 08:28 被阅读0次

    第1章 机器视觉在行业中的应用  

    机器视觉的主要应用场景,了解机器视觉都能应用在哪些领域、解决哪些问题。

    1.1 机器视觉的发展背景

    人工智能(Artificial Intelligence,AI)是计算机科学的一个分支,其意在了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。该领域的研究包括机器人、语言识别、机器视觉、自然语言处理和专家系统等。

    人工智能是一个比较大的领域,其中包括机器学习、深度学习、模式识别等,而神经网络是机器学习中的一种方法,深度学习又是神经网络方法中的一个子集。

    历史上人工智能经历了三次“春天”。

    人工智能的概念于20世纪50年代被首次提出,当时人们觉得人工智能在20年之内会改变世界,所有的 工作都会被人工智能颠覆。直到1973年的《莱特希尔报告》明确指出当时人工智能的任何部分都没有达到人们想象的水平,第一个“春天”随之结束。

    第二个“春天”是20世纪80年代,神经网络和反向传播算法的提出,以及专家系统的初步结果,让科学家和企业家再次看到了希望。但因为普通神经网络不可避免的问题以及专家系统的局限,第二次热浪也逐渐冷却。

    现在,随着深度学习技术的崛起,CHATGPT,文心一言,人工智能正迎来第三个“春天”。

    1.1.2 机器视觉

    机器视觉是人工智能的一个重要分支,其核心是使用“机器眼”来代替人眼。

    机器视觉系统通过图像/视频采集装置,将采集到的图像/视频输入到视觉算法中进行计算,最终得到人类需要的信息。

    这里提到的视觉算法有很多种,例如,传统的图像处理方法以及近些年的深度学习方法等。

    1.2 机器视觉的主要应用场景

    1.2.1 人脸识别

    人脸识别(Face Recognition)是基于人的面部特征信息进行身份识别的一种生物识别技术。它通过采集含有人脸的图片或视频流,并在图片中自动检测和跟踪人脸,进而对检测到的人脸进行面部识别。人脸识别可提供图像或视频中的人脸检测定位、人脸属性识别、人脸比对、活体检测等功能。

    人脸识别分为4个处理过程——人脸图像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别。

    支付宝,微信,银行,保险等都在用人脸识别,目前该技术已经处于大规模商用阶段,未来3~5年仍将继续保持高速增长。

    1.2.2 视频监控分析

    视频监控分析是利用机器视觉技术对视频中的特定内容信息进行快速检索、查询、分析的技术。

    视频/监控领域盈利空间广阔,商业模式多种多样,将视觉分析技术应用于视频监控领域正在形成一种趋势,目前已率先应用于交通、安防、零售、社区、楼宇、校园、工地等场合。

    1.2.3 工业瑕疵检测

    机器视觉技术可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛应用于工业瑕疵诊断、工况监视和质量控制等领域。

    1.2.4 图片识别分析

    这里所说的图片识别是指人脸识别之外的静态图片识别,图片识别可应用于多种场景,目前应用比较多的是以图搜图、物体/场景识别、车型识别、人物属性、服装、时尚分析、鉴黄、货架扫描识别、农作物病虫害识别等。

    1.2.5 自动驾驶/驾驶辅助

    自动驾驶汽车是一种通过计算机实现无人驾驶的智能汽车,它依靠人工智能、机器视觉、雷达、监控装置和全球定位系统协同合作,让计算机可以在没有任何人类主动操作的情况下,自动安全地操作机动车辆。机器视觉的快速发展促进了自动驾驶技术的成熟,使无人驾驶在未来成为可能。

    1.2.6 三维图像视觉

    三维图像视觉主要是对三维物体进行识别,其主要应用于三维机器视觉、双目立体视觉、三维重建、三维扫描、三维测绘、三维视觉测量、工业仿真等领域。

    三维信息相比二维信息,能够更全面、真实地反映客观物体,提供更大的信息量。

    近年来,三维图像视觉已经成为计算机视觉领域的重要课题,在虚拟现实、文物保护、机械加工、影视特技制作、计算机仿真、服装设计、科研、医学诊断、工程设计、刑事侦查现场痕迹分析、自动在线检测、质量控制、机器人及许多生产过程中得到越来越广泛的应用。

    1.2.7 医疗影像诊断

    医疗数据中有90%以上的数据来自于医疗影像。医疗影像领域拥有孕育深度学习的海量数据,医疗影像诊断可以辅助医生做出判断,提升医生的诊断效率。

    1.2.8 文字识别

    计算机文字识别,俗称光学字符识别(Optical Character Recognition),是利用光学扫描技术将票据、报刊、书籍、文稿及其他印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。

    1.2.9 图像/视频的生成及设计

    人工智能技术不仅可以对现有的图片、视频进行分析、编辑,还可以进行再创造。机器视觉技术可以快速、批量、自动化地进行图片设计,因此其可为企业大幅度节省设计人力成本。

    1.3 本章小结

    目前绝大部分数字信息都是以图片或视频的形式存在的,若要对这些信息进行有效分析利用,则要依赖于机器视觉技术的发展,虽然目前已有的技术已经能够解决很多问题,但离解决所有问题还很遥远,因此机器视觉的应用前景还是非常广阔的。

    相关文章

      网友评论

        本文标题:人工智能00001 深度学习与图像识别书评01 机器视觉在行业中

        本文链接:https://www.haomeiwen.com/subject/spsevdtx.html