微软研究人员声称 GPT-4 显示出 AGI 的“火花”

作者: 数科每日 | 来源:发表于2023-03-25 00:11 被阅读0次

[追热点]Rust学习资源整理
AI Edge: 微软加入AGI大战 | 深度学习有组解决非洲食
数据科学简讯 2023-02-28
AGI
AgI
STK组件：利用双行根数TLE做过境预报
2018年AI新趋势——AGI
每日安全资讯（2020.05.08）
AGI实现思路重新整理
黑客正利用另一种新技术绕过Office 365安全机制开展网络钓

原文：Microsoft Researchers Claim GPT-4 Is Showing "Sparks" of AGI

“我们相信 GPT-4 的智能标志着计算机科学及其他领域真正的范式转变。”

在 GPT-4 公开发布之后，微软 AI 科学家团队发表了一篇研究论文，声称 OpenAI 语言模型——显示出人类智能或通用人工智能的“火花” （通用人工智能 AGI）。

Paper

强调“火花”。研究人员在论文中谨慎地将 GPT-4 的能力描述为“只是迈向一系列日益普遍的智能系统的第一步”，而不是完全孵化的人类级 AI。他们还反复强调了一个事实，即这篇论文是基于 GPT-4 的“早期版本”，他们在“仍在由 OpenAI 积极开发”时研究了它，而不一定是已经被纳入产品的版本.

不过，除了免责声明之外，这些都是一些严肃的声明。虽然很多人，甚至人工智能行业的一些人，都认为 AGI 是一个白日梦，但其他人认为开发 AGI 将迎来人类未来的下一个时代；下一代 GPT-4 是迄今为止 OpenAI 构建的大型语言模型 (LLM) 最强大的迭代，并且在潜在 AGI 竞争者的理论列表中，GPT-4 位于列表的顶部。

“我们认为，”研究人员在昨天发表的论文中写道，“（这个早期版本的）GPT-4 是一组新的 LLM（以及 ChatGPT 和谷歌的 PaLM）的一部分。”

就研究人员的推理而言，他们基本上只是认为 GPT-4 比之前的其他 OpenAI 模型更强大。设计一个在特定考试或任务中表现出色的模型是一回事——构建一个可以完成很多任务并且做得很好的设备，而无需任何特定培训，则是另一回事。他们说，后者才是 GPT-4 真正闪耀的地方。

“我们证明，除了对语言的掌握之外，GPT-4 还可以解决跨越数学、编码、视觉、医学、法律、心理学等领域的新颖而困难的任务，而无需任何特殊提示，”论文中写道。 “此外，在所有这些任务中，GPT-4 的表现都非常接近人类水平，并且常常大大超过 ChatGPT 等先前的模型。”

“鉴于 GPT-4 功能的广度和深度，”他们继续说道，“我们相信它可以合理地被视为人工智能 (AGI) 系统的早期（但仍不完整）版本。”

这些研究人员确实有道理。 GPT-4 当然还有它的缺陷；与其他法学硕士一样，该机器仍然存在幻觉问题，并且在数学方面可能会遇到困难。但不管它的失误如何，该模型确实有一些突出的 - 并且比上一个模型有很大改进 - 技能。例如，GPT-4 是一个特别优秀的应试者，在法律律师考试、LSAT 甚至是认证侍酒师理论考试等众所周知的困难考试中分别取得了第 90、88 和 86 个百分位数——而且，在考试之前没有经历过任何形式的培训。

对比一下：去年年底发布的 GPT-3.5 在所有考试者中得分倒数 10%。二者相比，这是一个巨大的进步。

此外，研究人员声称，他们的研究表明该机器人“克服了一些基本障碍，例如获得许多非语言能力”，同时还“在常识方面取得了巨大进步”——后者是 ChatGPT 的最大障碍之一。

尽管如此，AGI 的论点还有一些警告，研究人员在论文中承认，虽然 GPT-4“在许多任务上达到或超过人类水平”，但它的整体“智能模式绝对不像人类”所以，基本上，即使它确实很出色，它仍然不会像人类那样思考。（也可以说，考试对机器人更加友好，但我们离题了。）

值得注意的是，自今年早些时候微软与 OpenAI 建立了数十亿美元的合作伙伴关系以来，微软研究人员可能会无意识地或以其他方式炒作 OpenAI 的工作。

正如科学家们还指出的那样，AGI 仍然没有一个坚定的、公认的定义——就此而言，更普遍的“智能”概念也没有。

“我们声称 GPT-4 代表了 AGI 的进步并不意味着它在它所做的事情上是完美的，或者它接近能够做人类可以做的任何事情（这是 AGI 的通常定义之一），或者它具有内在动机和目标（AGI 某些定义中的另一个关键方面），”该论文中写道。

但他们说，前进只有一步也是前进。

“我们相信 GPT-4 的智能，”研究人员写道，“标志着计算机科学及其他领域真正的范式转变。”