美文网首页AI书籍
《AI 3.0》读书笔记2 序1

《AI 3.0》读书笔记2 序1

作者: 银河星尘 | 来源:发表于2024-02-26 22:13 被阅读0次

    《AI 3.0》读书笔记1

    段永朝
    财讯传媒集团首席战略官
    苇草智酷创始合伙人

    侯世达的恐惧:

    “不是担心人工智能太聪明,而是担心人工智能太容易取代我们人类所珍视的东西。”

    人工智能领域发展得实在是太快了,已经渗透到日常生活的各个角落。不知不觉,我们周围的一切似乎都变得智能了,都被“强壮”的机器代码、算法接管了,人工智能彻底接管这个世界似乎越来越现实,越来越不容置疑了。

    人工智能的历史遗留问题

    本书第一部分回顾了人工智能超过半个世纪的发展历史

    人工智能领域有两类主要的人工智能:

    • 一类是符号人工智能(symbolic AI)

      • 前者的基本假设是智能问题可以归为“符号推理”过程
      • 这一学派也被称为“心智的计算理论”(computational theory of mind,CTM)学派。
        • 这一理论可追溯至计算机鼻祖法国科学家帕斯卡以及德国数学家莱布尼茨
        • 真正体现这一思想的所谓智能机器,源于英国的查尔斯·巴贝奇(Charles Babbage)以及艾伦·图灵(Alan Turing)的开创性工作。
    • 另一类是以感知机为雏形的亚符号人工智能(subsymbolic AI)

      • 亚符号人工智能的出现归功于行为主义认知理论的崛起,
      • 可追溯至英国哲学家大卫·休谟和美国心理学家威廉·詹姆斯,其思想基础是“刺激-反应理论”。
        • 20世纪40年代,美国神经生理学家麦克卡洛克(W. S. McCulloch)、匹茨(W. A. Pitts)提出神经元模型后,
        • 心理学家弗兰克·罗森布拉特(Frank Rosenblatt)提出了感知机模型,这奠定了神经网络的基础。

    2个问题:

    • 为什么2个领域都停滞了?

      • 20世纪五六十年代的人工智能,在符号演算和感知机两个方向上都陷入了停滞。80年代兴起的专家系统和神经网络,也因为受制于计算能力和对智能的理解,并未获得实质性的突破
        • 理解人工智能的关键——算法:只是计算能力和符号演算的逻辑基础
    • 为什么尚未触及智能问题的核心?

      • 迄今为止令人眼花缭乱的智能突破,其实尚未触及智能问题的核心——自然语言理解和意义问题

    到底什么是机器学习

    本书第二部分分析了视觉领域的技术进展

    • 用来理解人工智能核心算法演变的历程。
    • 视觉领域广泛使用的专业工具是ConvNets
    • 视觉领域的创立者包括日本学者福岛·邦彦(Kunihiko Fukushima),以及法国计算机科学家杨立昆(Yann LeCun)

    米歇尔定义什么是视觉识别:
    无非是训练出某种算法,使得机器可以利用这种算法来识别和命名它所“看到”的世界。

    视觉识别的工作过程被分为两个步骤:

    1. 给机器注入一定量的已知素材
    • 比如包含猫、狗等事物的图片信息,这些信息在机器“眼里”无非是细碎的小方格——像素。
    1. 对机器进行大量的训练
    • 让机器把这些图片中所包含的“特征”一一抽取出来。

    • 面对一个不知道其内部构造的对象,要想猜测出其内部构造具备哪些特征

      • 属于“信号处理”学科
      • 最著名的方法就是所谓“卷积变换”,也称傅立叶变换。由法国数学家傅立叶提出。
        • 通过傅立叶变换将对象的时域过程转换成方便计算的频域过程。

    控制论创始人诺伯特·维纳(Nobert Wiener)将“反馈”的概念引入系统控制

    • 信号处理问题:

      • 一个输入信号经过某个信号装置,产生特定输出的过程。
      • 面临的问题是:
        • 在不知道信号装置本身的详细信息的前提下,如何通过输入特定的信号序列刺激信号装置产生特定的输出,从而根据这一特定的输出信号序列,推测出信号装置的特征?
        • 举例:
          • 假设有一个黑箱,数学上用一种函数来表示黑箱的特征,这种函数可称为特征函数,你若想知道这个黑箱的特征,可以往黑箱里输入一个信号序列(输入函数),然后观测黑箱在这个输入函数的刺激下,产生的输出函数有什么表现。
    • 人工智能在视觉系统上的应用,以及一切所谓深度学习(deep learning)算法

      • 从数学角度上看,无非是使用20世纪七八十年代的多层神经网络(multilayer neural network),通过傅立叶变换来求解对象的特征方程的过程。
    • 应用深度学习算法时,通常会将数据集分为“训练集”和“测试集”两个部分:

      • “训练集”:训练集的数据集,用来做猜测,猜测对象是什么东西;
      • “测试集”:测试集的数据集则用以对在训练集上取得的成果进行验证并优化相关参数,以便更准确地适应不同形态的对象。
    • 深度学习又分为监督学习和无监督学习两种

      • 监督学习,事实上就是通过人机交互,明确告诉算法猜对了还是猜错了。这种学习过程需要人机交互,也需要明确的关于对象的先验知识,其应用场合是受限的,且效率低下。
      • 无监督学习则是需要学习机自行判断结果是否恰当,进而优化判别参数。比如生成式对抗网络(GAN)应用的就是无监督学习,它可以根据此前的学习结果,构造出全新的模式(全新的猫或者狗),来拓展对象认知的边界。当然,无监督学习仍然需要人为的干预,因为说到底,学习算法并不“认识”这个世界。

    相关文章

      网友评论

        本文标题:《AI 3.0》读书笔记2 序1

        本文链接:https://www.haomeiwen.com/subject/adzzadtx.html