现有技术:机器学习的严重缺陷
-
目前人工智能的主要技术——机器学习,其原理带来的局限:
概率、函数拟合:只是估计,不够准确
函数拟合.png以历史数据预测未来:没有掌握本质规律
安全隐患:具体思维过程不可解释、不可控,即使成功也会威胁人类
(比如,很多30岁的奶爸在买啤酒的同时也买了尿布,张三也是30岁男性、也买了啤酒,机器学习会推荐给张三尿布,但张三没有孩子!如果系统知道张三没有孩子的本质,就不会这样推荐) -
机器学习只适用于没有掌握本质的时候
小冰对话1-1.png
小冰对话1-2.png
小冰的一个愚蠢回答,表示其是从语料库中找关联
-
如果能有透明的白盒(能看见本质的),为什么还要机器学习的黑盒?
-
So, 人类语言的本质是什么?
本人已发现人类语言的本质,即真正理解人类语言的强AI,如感兴趣,请联系我,本人赵鹏阳,邮箱zpyzly@126.com
语言 = 词语 + 语法 + 常识
要理解语言,先理解词义
需要一本机器看得懂的词典去向机器解释词义
学术界缺乏对词义本质上的、可实现的研究
对词义的解剖——构成词义的基本元素的寻找,就是让机器理解语言的关键!
化学中发现了化学元素,才能分析化学反应
物理学中的基本粒子,是近代物理的基础
构成词义的基本元素,是让机器理解自然语言的基础
现有技术:
知识图谱:没有解释词义,只是简单的事物归类
语义网络,如WordNet:解释了词义,但存在循环引用,无法用程序实现
如下例,一个词语“include”的解释包含了“part”,“part”的解释又包含了“include”:
include -- have as a part,
part -- something determined in relation to something that includes it;
HowNet:
有词义最小单元的概念,但是其非系统化的多维度分类(分类之间没有联系、对分类没有进一步解释、简化),没有精确、简洁地解释词义,导致越来越复杂,掺杂错误,无法应用
没有解释情感等复杂词语
image.png
我们看几个词语的解释:
“优点”可解释为“好的性质”
“骄傲”可解释为“因为自己好的行为产生的感觉”
“羡慕”是“因为他人的好的性质产生的感觉”
“推荐”意思是“认为……是更好的,可以用来……”
“获得”是“开始有”;“放弃”是“停止有”
“好”、“有”等是广泛存在于词语解释中的词义,这种最基本的词义称为“词义元素”,简称“义元”
经过对4000多个常用词汇的研究(包括情感等复杂词汇),本人发现并已验证,任何词义都是由若干义元直接或间接构成
义元类似化学元素——任何分子都是由化学元素的原子构成,任何词义都是由义元构成
从原理上验证
语言是人类对世界的反映,世界是由一些表面看不到、只存在于底层的基本元素组成的——这是普适规律
“道生一,一生二,二生三”; 例如:物理学中的基本粒子,生物学中的细胞,计算机的0和1
所以语言的基础——词义也是由一些底层基本元素构成
理解了基本元素,才能理解所有
image.png image.png
输入个体的句子,与其头脑中已知句子之间产生逻辑运算,就是理解
词义都由义元构成,显然句子都由义元构成
输入句子和已有句子含有相同或相关义元,则他们有语义关系,可进行推理等逻辑运算,即达到理解效果
总之,将词义转化为义元组合,消除了意义相关的不同词之间的隔阂,是复杂集合到简单集合的转化。
欢迎挑战我:任何词语的理解例子;给我任意一篇文章及问题,我将演示如何让机器做阅读理解
image.png
网友评论