美文网首页
全面解剖人工智能

全面解剖人工智能

作者: 方弟 | 来源:发表于2016-12-09 17:08 被阅读0次

    目前LISP语言仍然是人工智能系统重要的程序设计语言和开发工具;

    认知建模是信息处理过程、也是知觉、记忆、思维、判断、推理、问题求解、学习、想象、概念形成和语言使用等;

    知识表示问题一直是人工智能研究最活跃的部分,知识表示方法有逻辑模式、产生式系统、框架、语义网络、状态空间、面向对象和连接主义等;

    自动推理也是人工智能研究核心问题:分为演绎推理(目前大多数成功智能系统使用)归纳推理(是机器学习和知识发现的重要基础)反绎推理;

    搜索也是人工智能的一种求解方法,可分为无信息导引的盲目搜索和利用经验知识导引的启发式搜索;

    机器学习方法有归纳学习、类比学习、分析学习、强化学习、遗传算法、连接学习、迁移学习、深度学习;

    人工智能研究的主要学派:符号主义学派、连接主义学派、行为主义学派

    符号主义(物理符号系统与有限合理性原理,从符号主义观点看,知识表示是人工智能的核心,认知就是处理符号,推理就是采用启发式知识及启发式搜索对问题求解过程,而推理过程又可以用某种形式化的语言来描述)

    连接主义(以人工神经网络模型为核心:以分布式的方式储存信息、以并行方式处理信息,具有自组织、自学习能力、适合于模拟人的形象思维,可以比较快的得到一个近似解,但不适合模拟人的逻辑思维)也是神经网络理论和技术研究不断发展与加上现在的云计算和大数据才使图像处理、模式识别、语音识别等领域得到重要突破;

    行为主义(侧重研究感知-行动的反应机制:基于智能控制系统理论、方法和技术,研究拟人的智能控制行为,采用集中式的模式与不同的行为模块与环境交互达到智能化,自主学习化)目前知识的形式化表达和模型化方法是人工智能的重要障碍之一;

    人工智能的应用:专家系统、数据挖掘、自然语言处理、智能机器人、模式识别、分布式人工智能、互联网智能、博弈;

    专家系统=知识库+推理机:具有专门知识和经验的计算机智能程序系统,通过人类专家的问题求解能力的建模,采用人工智能中的知识表示和知识推理技术来模拟通常由专家才能解决的复杂问题,达到具有专家同等解决问题的能力水平;

    其实专家系统强调的是知识而不是方法,很多问题是算法解决方案无法解答的;一个专家系统需要具备以下3个要素:1.具备某个应用领域的专家级知识;2.能模拟专家的思维;3.能达到专家级的解题水平;专家系统开发工具有:EMYCIN、CLIPS(OPS5、OPS83)、G2、KEE、OKPS等;

    数据挖掘:需要大量的原始数据、明确的挖掘目标、相应的领域知识、友善的人-机界面,以及寻找合适的开发方法;

    自然语言处理研究内容包括:语言计算(语音与音位、词法、句法、语义和语用等各个层面上的计算)、语言资源建设(计算机词汇学、术语学、电子词典、语料库和知识本体等)、机器翻译或机器辅助翻译、汉语和少数民族语言文字输入输出及其智能处理、中文手写和印刷体识别、中文语音识别及文语转换、信息检索、信息抽取与过滤、文本分类、中文搜索引擎和以自然语言为枢纽的多媒体检索;

    模式识别呈多样性和多元化趋势:语音识别、文字识别、图像识别、人物景象识别、生物特征识别有指纹(掌纹)识别、人脸身份识别、签名识别、虹膜识别、行为姿态身份识别;

    分布式人工智能系统:新的信息系统、决策系统、知识系统

    从计算机程序组织来看,一般智能系统可以看成是三级结构,即数据级、知识库级、控制级;数据级是关于求解的特殊问题及其当前状态的陈述性知识;

    知识库级是具体领域问题求解的知识,它常常是一种过程,说明怎么样操纵数据来达到问题求解,反映动作的过程;控制级是过程性知识的控制策略,相应于控制性知识或元知识;

    如何构建合适的知识表示方法?1.表现能力、要求能够正确、有效地将问题求解所需要的各类知识都表示出来;2.可理解性,所表示的知识易懂易读;3.便于新的知识的获取,使得智能系统能够渐进地增加知识,逐步进化;

    4.便于搜索,表示知识符号结构和推理机制应支持对知识库的高效搜索,使得智能系统能够迅速地感知事物之间的关系和变化,同时也很快的从知识库中找到有关的知识;5.便于推理,要能够从已有的知识中推出需要的答案和结论;

    日常常用的知识表示方法有谓词逻辑、产生式系统、语义网络、框架、状态空间、脚本和本体;

    谓词逻辑知识表示方法具有充分的表示能力但也有不足地方:1.效率低,形式推理使推理过程冗长,效率低,推理过程中会出现组合爆炸行为;2.灵活性差,不便于表达启发式知识和不精确的知识;

    产生式系统是目前人工智能应用最广泛的知识表示方法,产生系统有三大部分组成:规则库、综合数据库、工作区、控制系统;产生式系统的基本控制流程是识别—动作循环,对规则搜索和匹配,从问题初始状态到达目标状态;

    产生式系统优点:容易模块化、容易建立解释机制、类似人类认知学习过程;缺点:难以扩展,尽管规则形式上相互独立但是实际问题中往往彼此是相关联的;规则选择效率较低,在推理过程中每一步都要与规则库中的规则进行匹配检查,知识库中规则数目庞大,显然最后效率降低;

    控制策略不灵活,产生式系统往往采用单一的控制策略,如顺序考察规则库中的每一条规则,同样会降低系统的效率;知识表示形式比较单一,产生式系统比较适合于表示非结构化的知识,对于结构化的知识可能用语义网络或框架或面向对象的表示更为合适;

    语义网络中最灵活的是ISA链是一个(IS—A)表示一个事物是另一个事物的一个实例;常用的语义联系有:类属关系、聚集关系、相似关系、推论关系、因果关系、占有关系、组成关系、时空关系;

    框架网络:相互关联的框架连接起来组成的框架系统,不同的框架网络又可以通过信息检索网络组成更大的系统,代表一块完整的知识;框架的层次结构利于查询检索与节省大量储存量;

    Cyc是一个超大型的、多关系型知识库和推理引擎;目前的知识表示一般都是从具体应用中提出,但依然偏重于实际应用,但缺乏系统的知识表示理论;这些知识表示方法都是面向领域知识的,对于常识性知识的表示依然没有取得很大的进步发展,目前需要亟待解决;

    启发式搜索通常用于两种不同类型的问题:正向推理和反向推理;正向推理一般用于状态空间的搜索,在正向推理中,推理是从预选定义初始状态发向目标状态方向执行;反向推理一般用于问题归约中;在反向推理中,推理是从给定的目标状态向初始状态执行;

    爬虫算法是一种局部择优的方法,是采用启发式方法,对深度优先搜索的一种改进;

    迁移学习:目标是将从一个环境中学到的知识用来帮助新环境中的学习任务;在传统分类学习中,为了保证训练得到的分类模型具有准确性和高可靠性,都有两个基本的假设:1.用于学习的训练样本与新的测试样本满足独立同分布的条件;2.必须有足够可利用的训练样本才能学习得到一个好的分类模型;但是在实际应用中发现要满足这两个条件往往很困难;

    迁移学习分为三类:归纳迁移学习(源任务和目标任务不一致但相关)直推式迁移学习(源领域和目标领域不一致但相关,源任务及目标任务相同,也就是说源领域中有大量标注语料而目标领域缺少标注语料;

    当源领域和目标领域的特征空间相同但概率分布不同时,直推式学习类似于领域自适应方法)无监督迁移学习(源领域和目标领域不一致但相关,源任务和目标任务不一致但相关,且此时源领域和目标领域都缺乏标注语料)

    迁移学习方法按照所用迁移知识形式可以分四类:1.基于实例的迁移学习(假设源领域部分数据可以解决目标领域学习问题)2.基于特征的迁移学习(期望通过迁移知识用来解决目标领域的任务性能)当有标记的辅助数据难以得到时,可以利用大量无标记的辅助数据进行迁移学习;

    自学聚类的基本思想是通过同时对源数据与辅助数据进行聚类得到的一个共同特征表示,而这个新的特征表示由于大量的辅助数据,所以会优于仅基于源数据而产生的特征表示,从而对聚类产生帮助;

    3.基于参数的迁移学习:当源任务和目标任务共享参数模型中的参数或者先验分布时,将迁移知识表示成共享的参数,从而完成目标任务;4.基于关系知识的迁移学习:在源领域和目标领域的数据相关的情况下,解决相关领域的迁移学习问题;

    总结:归纳迁移学习一般采用基于实例的、基于特征、基于参数的和基于关系知识的迁移学习;直推式学习任务通常采用基于实例的和基于特征的迁移学习方法;无监督迁移学习常用的方法是基于特征表示的迁移学习;

    一般实现统计学习的步骤如下:1.准备有限的训练数据集;2.获取包含所有可能的模型的假设空间,即学习模型的集合;3.确定模型选择的准则,即学习策略;4.实现最优模型的算法,即学习的算法;5.通过学习方法选择最优模型;6.利用学习的最优模型对新数据进行预测或分析;

    遗传算法非常适合用于大规模并行计算机:它在搜索过程中不容易陷入局部最优,即使在所定义的适应函数是不连续的、非规则的或有噪声的情况下,也能以很大的概率找到整体最优解;

    一般来说,专家系统中的知识库与专家系统程序是相互独立的,用户可以通过改变、完善知识库中的知识内容来提高专家系统的性能;

    知识获取是专家系统开发过程中最难的一步,获取知识有以下4种方式:1.通过知识工程师人工抽取知识与经验;2.通过采用知识编辑程序辅助抽取知识与经验;3.通过采用数据挖掘程序自动抽取专家的知识与经验;4.通过采用文本理解程序自动抽取书本中的知识;

    新型专家系统:分布式专家系统(设计一个分布式专家系统一般要考虑功能分布、知识分布、驱动分布:控制驱动,即是某个模块控制、数据驱动,输入数据后自动驱动、目标驱动、事件驱动)

    协同式专家系统:对于一个协同式专家系统需要考虑多个智能体之间的协同方法、知识的组织和分布、裁决方法、驱动方式及系统结构等;神经网络专家系统:神经网络系统是将神经网络与传统专家系统集成所得到的一种新型专家系统;

    神经网络具有自组织、自学习、自适应、分布储存和并行处理等功能,比较适合模拟人类的低级感知智能;传统的专家系统常以逻辑推理为主,适合模拟人类的高级智能,两者结合可以做到优势互补;一旦网络的拓扑结构确定后,便可以利用连接学习方法产生相应的权值和阀值;目前许多算法可以达到这个目的:比如Pocket算法、反传学习算法和玻耳兹曼机等;

    神经网络专家系统是通过训练学习完成的,机器学习程序可以从实例中提取有关知识,并通过矩阵及系统参数进行学习训练,将有关知识以网络或动力系统形式表示;多层神经网络的内部表示可用分块邻接权值矩阵和阈值向量描述;

    基于神经网络的知识表示方法如下优点:1.具有统一的内部知识表示形式,通过学习程序即可获得网络的相关参数,如分块邻接权值矩阵、节点偏移向量等;任何知识规则都可变化成数字形式,便于知识库的组织和管理,通用性强;2.便于实现知识的自动获取;3.利于实现并行联想推理和自适应推理;4.能够表示事物的复杂关系,如模糊因果关系;

    国际上出现著名的多智能体系统:如CooperA、GRATE和InteRRap;中国技术研究院的MAGE;

    多智能体系统是分布式人工智能最活跃的研究领域,研究在群体智能体间进行智能行为的协调;智能体具有自治性、交互性、协作性和自适应性等特点,构建的多智能体系统具有更大的灵活性,更能体现人类社会智能性,更加适应开放的和动态的真实世界环境;

    目前主流的移动机器人视觉系统有单目视觉、双目立体视觉(难点在于对应点匹配问题,可以用到定位导航、避障、地图构建方面)、多目视觉(提高视觉精确度但是算法更加复杂,消耗时间长)、全景视觉(图像拼接技术)混合视觉系统(吸收各种视觉系统的优点组合、系统配置高但费用较高)

    移动机器人常用的定位技术:1.基于航迹推算的定位技术;2.基于信号灯的定位方法;3.基于地图的地位方法;4.基于路标定位方法;5.基于视觉的定位方法;

    机器人的智能点来自于几个方面:

    第一,有基本的对话功能。这个是来自于一个技术,叫做深度神经网络;第二,要能够完成某种任务。比如信息搜索或者是总结,或者是生成一个对话,这个是需要强化学习的能力;第三,叫做迁移学习,这是一个新的研究方向。它能够做什么呢?它可以把一个通用模型个性化,让一个大数据产生的模型在个人的小数据上面个性化,这样可以产生一个很体贴的机器人。

    情感机器人必须具备3个基本系统:情感识别系统、情感计算系统、情感表达系统;

    人脑是由神经网(硬件)和心智系统(软件)构成的智能系统;

    相关文章

      网友评论

          本文标题: 全面解剖人工智能

          本文链接:https://www.haomeiwen.com/subject/dxzemttx.html