实现人类智力等级的人工智能的突破是知识理解/抽取/检索/压缩的实现和可计算通用本体论与认知计算。
我已经自己研发了这两个关键技术,使知识相关的技术可以实现。
实现这一目标的关键是通过可计算的通用本体、认知计算和一种能够实现自然语言处理的新语言来实现知识的理解/提取/检索/压缩。因此,我可以充分利用文本中所有的人类知识,以最少的监督建立一个庞大的可计算的本体论知识库。在这个阶段,我期望一个16岁的有着平均智力的高中毕业生,在短时间内具备建成一座桥或一辆车的知识,也就是说,打造一个知识搜索引擎,现用现查,在我眼里这是十分容易实现的。我认为用文字记载的全部人类知识可以压缩至1tb以内甚至少至几mb。实现后就可以用改进的传感器来实现人类智慧级的人工智能了,我们需要通过标记来帮助它们把概念映射到实体上(抽象和实体)。(这是什么妈妈?这是书桌。)。这个时候没有什么比现在更适合使用深度学习的算法来搞定剩余的东西。我对使用深度学习场景的看法是,我们使用一个小的初始量(比较)知识和少量相应的结果,来解决黑箱中的方程,使之具备这样的能力,以相似的方式处理相似的未知事物。人工智能需要一个庞大的初始知识量,但随着知识理解、提取的实现,它将会以超级速度被建立起来,可以在短时间内超过CYC。
知识提取=
可计算通用本体+
本体知识库+
语义学+
新的语言+
弱自然语言处理
可计算通用本体(信息通用框架):
关键是要使客观的、主观的各种信息都能适应来。并使关键的属性比如常见的物理属性可计算,如空间/时间/方向,并使抽象属性可比。其中包含了认知计算。
本体知识库:
分类和表示所有事物,包括各种实体,它们的属性,它们的行为和它们之间的关系。最初需要一定的初始数量来建立一个更大的需要更少监督的知识库。这种知识库不仅是为人类构建的,而且是计算机直接使用的。推理系统包含在其中。一些抽象实体,我们将特别处理它们,通过建模和使其可计算,如物理属性,如时间/空间/方向/位置或其他属性在任何专业领域。
语义的:
消除模棱两可的定义。
新的语言:
旧的自然语言组织不好,成为表达和查询知识的障碍。它减慢速度,给人类带来困难。我知道这种语言不是一个人创建的,贡献者来自全国各地古今中外许多领域。有点混乱,没有统一的逻辑。让我们把它重新整理下。
自然语言的力量是非常有限的,因为它的定义含糊不清,有时没有普遍的确定性定义。当我们交流时,如果关键字代表不同的定义,那么交流就没有意义了。这是一个古老的哲学话题。
新语言是赋予每一个实体一个独特的意义。不允许存在模棱两可的定义或多个用途。任何实体/信息/知识都可以确定地描述。客观信息和主观信息可以以一定的形式表现出来,具有充分的灵活性。通过这种新的语言和逻辑,我们可以实现高比率的知识/信息压缩和最终灵活的知识/信息表示。客观默认指的是统一标准的电脑,其实一切都是主观的,作为参照物,某些有统一结构的客体可以当做是客观的。
如你所见,信息是为了增强确定性。歧义就是增加不确定性。这是对信息的背叛。如此情况下歧义必须先消灭掉。
有了这种新的语言,我希望人们能更快地交流知识,这将是世界上用语言交流知识的最快速度。(毕竟,神经信号可能是最快的),一个非常复杂的知识可以用一种非常简单的方式描述。虽然现在可以用缩略词,成语或其他任何东西来做,但它不是基于统一的逻辑,没有统一的唯一定义,这是非常重要的。
这将是人类和计算机的一场语言革命。
应该有专业的人员来一直更新与维护。
知识抽取:
利用上述技术,很容易实现知识抽取。
我可以肯定我能理解我能让计算机“理解”。(其实不能称为完全的理解直到我们帮助计算机将文本中的概念与现实生活中的实体一一对应起来)有了知识抽取就可以用最少的监督累计知识了。然后,一个更大的知识库,从任何基于文本的媒体的知识可以编译成结构化的知识,并能方便人类查询。因此,我期望一个16岁的有着平均智力的高中毕业生,在短时间内具备建成一座桥或一辆车的知识。我们将能瞬时地任意地使用到人类在地球上几千年中所有文本中蕴含的智慧。它将使今天的自然语言理解达到一个崭新的水平。在他的面前,Siri和Cortana都是儿童的玩具。它将使我们更快地进入自动化的下一个阶段-----通用人工智能。
通用人工智能:
当人们试图每次仅在一个专业领域中实现机器学习时,这是耗费时间的。
有一种方法,一次就可以搞定。
如果我们具备了自然语言处理和知识提取,通用人工智能基于增强先进的传感器和深度学习相关算法的实现是十分容易的。
在这个阶段,我希望通用人工智能可以自主学习。
一旦它有了学习的能力,它将很快自己学会如何做实验/高级推理。
而且在通用人工智能的帮助下解决机器人/机械模块、声音/视频(电磁波)/运动识别或神经脉冲信号的解密等问题非常容易。
最少的监督是必须的,因为人们必须告诉计算机他们是如何感知这个世界的,以及他们对这个世界的感觉,什么是好的,什么是不好的。直到能从硬件上模拟大脑,神经或认知,否则完全不存在无监督!很明显,我的实现方法是建立在软件的,模拟人类行为,基于断言(知识库)和逻辑的符号主义。
本人知识浅薄,全是自学自悟,言语粗略,逻辑不清,也许多有疏漏,欢迎广大朋友探讨交流。
版权所有
韩睿智
网友评论