美文网首页
机器学习的缺陷

机器学习的缺陷

作者: 御风_曜 | 来源:发表于2020-04-11 12:18 被阅读0次

机器学习的缺陷

机器学习的基础——概率

  • 预测下雨的概率,根据贝叶斯公式,P(雨|云)=P(云|雨)*P(雨)/P(云),是在我们仅仅知道这些的情况下算的概率,不保证一定准确。
  • 如果有人人工降雨,概率是98%,但你不知道这个信息,那么你前面贝叶斯公式算的就是错的。

机器学习的原理:以历史现象预测未来——通过函数的拟合

  • 将历史数据输入机器,让机器去找一个函数,尽量拟合历史数据。只是拟合,很多点实际是不在拟合函数上的,说明没有准确性,没有找到数据内在规律。
  • 机器学习是数据越多越准确,那么数据量是n时的拟合肯定不如数据量是n+1时的拟合,但数据量多大算够大?不知道。所以拟合永远是不准确的!
  • 为什么只根据表面现象(数据)去找规律呢?为什么不透过现象看本质呢?

表面的关联不代表内在的关联

  • 做法:通过大量数据统计出不同数据之间的关联性
  • 历史数据永远是不完整、不准确的
    由于永远无法收集所有数据、收集过程中的错误(人会犯错,软件会有bug,机器会出错),导致历史数据永远是不完整、有错误的
    所以未来无法完全符合历史数据
  • 表面现象的关联性不直接等于内在本质:为什么这样关联?机器学习不知道。表面的关联反应了什么内在本质?不知道。表面现象要经过人的理性分析、总结,得出内在本质规律
  • 在语言理解领域也要遵循此原则,要由人来解释语言、语义的规律,而不是单单由机器去总结规律。机器学习是跳过了理性思考,所以完全不理解语言,所以现有的聊天机器人很糟糕。
  • 机器能懂语言么?我们往往不相信。但我们为什么相信机器学习呢?为什么相信所谓的巨头、学术界大牛呢?
    技术有门槛,只能相信权威
  • 本技术——语义解构,正是填补了语义理解这一领域的理性空白——是将人总结的语义规律,翻译成程序语言

盲人摸象VS直接看

机器学习的适用范围
在没有掌握本质的时候,根据表面数据来粗略预测未来。机器学习未深入本质,只是根据表面现象“猜”,是很笨很低效的。打个比方,就好比把一个不会外语的中国人扔到外国,不去系统的学习外语,只靠每天听外语,即使再聪明,学习的速度也是很慢很费力的。
机器学习是没有针对本质的盲人摸象,所以:
不是人制定的章法,不可解释(请参阅机器学习的可解释性)
退一万步说,即使有一天解释了,也会耗费不必要的巨量计算资源,这个代价远大于其收益
退一万步说,机器学习如果搞定了自然语言理解,不可解释的机器学习主导的不可预测的机器人,将不被人类控制,就是恶魔统治世界。
为什么要让盲人摸象呢?可不可以直接看呢?

现有技术:对词义的解释,没有找到“门道”

知识图谱:没有解释词义,只是简单的事物归类
语义网络,如WordNet:解释了词义,但存在循环引用,无法用程序实现
如下例,一个词语“include”的解释包含了part,“part”的解释又包含了include:
include -- have as a part,
part -- something determined in relation to something that includes it;
HowNet:有词义最小单元的概念,但是其非系统化的多维度分类(分类之间没有联系、对分类没有进一步解释、简化),没有精确、简洁地解释词义,导致越来越复杂,掺杂错误,无法应用


知识图谱.png

一个知识图谱,对“骄傲”这个词只归类于“抽象事物”,没有解释其含义


hownet.png
现有技术——HowNet对一个词“顶点”的解释,多么复杂!
“高于正常”的都是顶点吗?No。所以这解释是错误的
“界限”“位置”又如何定义?没有。
按我的解释——“最高的点”,不是一目了然吗?

相关文章

  • 机器学习的缺陷

    机器学习的缺陷 机器学习的基础——概率 预测下雨的概率,根据贝叶斯公式,P(雨|云)=P(云|雨)*P(雨)/P(...

  • 真正理解人类语言的强AI

    现有技术:机器学习的严重缺陷 目前人工智能的主要技术——机器学习,其原理带来的局限:概率、函数拟合:只是估计,不够...

  • 01-特征抽取

    机器学习的数据 机器学习的文件一般都不存储在数据库中,常以文件形式存储,eg:csv数据库的缺陷:eg:mysql...

  • 人工智能、机器学习、深度学习的区别

    1、人工智能、机器学习、深度学习的区别 1.1 深度学习vs神经网络 神经网络的缺陷: 比较容易过拟合,参数比较难...

  • 基于机器学习的钢材缺陷检测分类

    公众号:尤而小屋作者:Peter编辑:Peter 大家好,我是Peter~ 今天给大家带来一篇机器学习在工业数据的...

  • 《深度学习》之第六章深度前馈网络

    机器学习中常见的逻辑回归和线性回归,都是线性的,它们简单高效。 但也有明细缺陷,表达能力弱,无法描述非线性问题。为...

  • C语言概述

    1、为什么学习C语言 C的起源和发展(机器语言、汇编语言、高级语言(结构化语言(缺陷数据和操作分离)、面向对象语言...

  • kube-batch--简介

    背景 K8s本身的调度器具有一些缺陷:(1) 默认的调度器是以 pod 为粒度的,对机器学习任务很不利。(2)默认...

  • 机器学习概述与算法介绍(二)

    机器学习概述 机器学习基本概念 机器学习基本流程与工作环节 机器学习中的评估指标 机器学习算法一览 3. 机器学习...

  • 如何评价算法的好坏

    机器学习是基于统计原理的预测。 如何判断?判断正确数与总数的比率?这种做法有缺陷,比如一堆人里预测癌症患者,因为发...

网友评论

      本文标题:机器学习的缺陷

      本文链接:https://www.haomeiwen.com/subject/bycymhtx.html