美文网首页
联结主义:第一节 机器学习

联结主义:第一节 机器学习

作者: 岑子哥 | 来源:发表于2021-06-26 03:22 被阅读0次

        图灵测试认为,只要测试者不能够区分与他对话的是人还是机器的时候,我们就认为认这台机器拥有了人工智能,很多专家也倾向于这样的测试,因为在这些人的心目他们的最大梦想就是能够模拟出和人一样聪明的机器人,然后代替人类工作。

    联结主义认为人工智能源于仿生学,特别是对人脑模型的研究将有利于人工智能取得突破性发展。它的代表性成果是1943年由生理学家麦卡洛克和数理逻辑学家沃尔特-皮茨创立的脑模型,即MP模型,开创了用电子装置模仿人脑结构和功能的新途径。它从神经元开始进而研究神经网络模型和脑模型,开辟了人工智能的又一发展道路。接着1949年家唐纳德·赫布在又提出了赫布理论,尤其是在弗兰克·罗森布拉特发明了感知器(图2-2-0)后,直接引发了20世纪60-70年代,以感知机为代表的脑模型的研究的热潮,由于受到当时的理论模型、生物原型和技术条件的限制,脑模型研究在20世纪70年代后期至80年代初期落入低潮(也有人说是因为马文-明斯基的抵制造成的)。直到物理学家约翰-霍普菲尔德在1982年和1984年发表两篇重要论文,提出用硬件模拟神经网络以后,联结主义才又重新抬头,从某种意义上说霍普菲尔德的贡献更为重要,因为没有霍普菲尔德网联结主义可能就夭折了。1986年,鲁梅尔哈特等人提出多层网络中的反向传播算法(BP)这一经典算法。此后,联结主义势头大振,从模型到算法,从理论分析到工程实现,为神经网络计算机走向市场打下基础。慢慢的行业内对人工神经网络的研究热情越来越高,尤其是2012年以来联结主义凭借深度学习在识别领域的辉煌战绩,开始独领风骚。

    图2-2-0弗兰克·罗森布拉特的感知器

        联结主义现在非常流行,很多人也或多或少的了解过,我这里就简单和大家说下机器学习的部分,为了方便理解我们这里把深度学习、神经网络、数据统计等统统归为机器学习这一类。

     既然机器学习这么流行,那么机器学习到底能干什么呢?其实机器学习它主要有四个作用。

    第一个作用就是聚类分析,什么叫做聚类,聚类就是我们把一些看似杂乱无章的事物用以一种或者几种方法对其分门别类。比如这边是男生,那边是女生,这个是蓝色的,那个是绿色的,这样是健康的,那样是有病的。

     比如,我们给出一张图片来,然后我们把距离相近的一些点聚成一类,一共分成两类,如图2-2-1所示。

    图 2-2-1 聚类

        第二个作用就是特征分析,特征分析我们用的也是非常多的,比如声音识别、指纹识别、人脸识别等,比如我们判断这个汉字是不是人字,那么怎么办呢?我们可以把这个汉字分割成4×4=16位的方格,然后在对应的方格内识别其局部的特征,然后再把这些特征的相似性加权起来,根据相似来判断这个汉字是不是特征了,如果像素足够小,组合的特征足够大,判断的准确性也就足够高了,如图2-2-2所示,我们只给出了四个方格的局部特征。

    图2-2-2 特征

        第三个作用密度分析,比如我们看到一张比较乱的图,比如我们想判断某段路线的交通情况,这时候可能有各种各样是数据,比如车辆型号,时间,司机性别能,其实我们只要知道某个时间点上该路线上一共有多少量汽车就可以了,这样我们基本上就可以判断出道路拥堵情况了。密度分析如图2-2-3所示。

    图2-2-3 密度分析

        第四个作用就是降维分析,降维分析可以把复杂的多维空间的数据,映射到低维空间上,让我们分析起来更加容易。降维分析如图2-2-4所示,我们很难去理解和计算一个球体,但是我们把三维的球体映射到平面上编程二维的圆形,就好理解和计算了。

    图2-2-4 降维分析

        机器学习大概就有上述四个作用,但是想要达到上述目的方式方法却有很多种,不仅仅是机器学习。比如深度学习、神经网络、隐马尔可夫、蒙特卡洛搜索、随机网络、贝叶斯、BP、α-β剪枝、线性规划、深度问答、随机聚类、迁移学习、支持向量机、长短学习等等

    至于具体是否采用机器学习技术,或者具体采用哪种机器学习技术,则需要根据团队和具体行业而定,没有最好的,但有相对合适的,比如,深蓝战胜卡斯帕罗夫,主要采用α-β剪枝,如图2-2-5所示;沃森参与危险边缘节目获胜,主要采用深度问答技术,如图2-2-6所示;AlphaGo(阿尔法狗)战胜李世乭,主要采用蒙特卡洛搜索技术,如图2-2-7所示;冷扑大师挑战中国龙之队获胜,主要采用线性规划技术,如图2-2-8所示;以上这些都是侧重了不同的算法和技术而达到了共同的目的。

    图2-2-5深蓝战胜卡斯帕罗夫,主要采用α-β剪枝 图2-2-6沃森参与危险边缘节目获胜,主要采用深度问答技术 图2-2-7 AlphaGO(阿尔法狗)战胜李世乭,主要采用蒙特卡洛搜索技术 图2-2-8冷扑大师挑战中国龙之队获胜,主要采用线性规划技术

        很多人说,他们接触到的机器学习,大都是黑箱,只知道结果但是却不知道怎么推导出来的。其实这些方式和方法可能不太重要,因为我们的框架里面默认即已经包含了这些算法,我们也很难逐一分析,其实这些算法剖析后也没有大家想的那么神秘,至少不是完美的,甚至很多机器学习的专家都经常要考虑到底使用哪个算法更合适。

    也许哪一天某个程序员的灵光一现,都是一种全新的算法,虽然别人也可能已经使用过了,但是有什么关系,只要我们机器学习的结果好就可以了。

    为了简单起见,我们就从机器学习的大数据着手开始。

    大家知道,我们让机器学习的时候,一定要给他很多数据它才能学习的更准确,那么这些数据要么就是杂乱无章的,比如我们给你很多张图片,什么也不说,然后让你在这些图片中找出几个最像的放在一起。要么有提示的,比如我们给你很多张图片,然后每张图片都告诉这张图片是什么。假设,这张是猫,那张是狗,然后让你找出和猫相似的图片,再找出和狗相似的图片。

    我们通常把第一种情况,也就是只有图片没有标签的学习叫做无监督学习,把第二种情况有图片并有说明的(有标签)的学习叫做有监督学习。

    目前来看,无监督学习是机器学习的主流,毕竟这个世界上大部分的数据都是没有标签的,或者就算是有标签也不见得准确。

    至于哪种学习更好,这要看具体情况,比如你想根据历史行情选择买卖股票的时间点,前天K线出现锤子线的时候第二天股票上涨,所以我们买入,而前天K线出现上吊线的时候昨天股票下跌,所以我们卖出,股票K线形态跟着股票价格甚至涨跌的这种情况,可能有监督学习就比较好。但是你想识别某个人的脸部特征可能无监督学习就比较好。

    或者干脆把有监督学习和无监督学习结合起来,效果也不错。将两者结合起来的学习也被称为混合学习。混合学习在某种意义上能够起到事半功倍的效果。

     有人甚至把机器学习的过程比作道士炼丹,道士放进了很多的配方,然后不断的炼制,至于炼出来的丹药,哪个炉子里的会好用我们并不知道,甚至丹药是怎么形成的我们也不知道。

     这也应了一句话:机器学习往往知其然,却不知其所以然。

    相关文章

      网友评论

          本文标题:联结主义:第一节 机器学习

          本文链接:https://www.haomeiwen.com/subject/wimeyltx.html