将真人与造假者分开
image.png艾伦·图灵除了在第二次世界大战期间破解了德国 ENIGMA 密码、发明了反应扩散系统并在计算机的发展中发挥了重要作用外,还是新兴人工智能领域的先驱。在他 1959 年的论文《计算机与智能》中,他提出了“图灵测试”,这是对“机器能思考吗?”这个问题的一种简单而实用的方法。
image.png他想出了一个“模仿游戏”的想法(是的,这就是关于他的电影的名字)。简单来说,如果审讯者(通过计算机终端)与伪装成人类的 AI 聊天,但无法判断它是否是人类,那么我们可以说 AI 通过了测试,实际上是'思维'。这是鸭子测试的一个版本,但用于智力。
虽然实际测试有点复杂和细微差别,但问题是,如果你在网上与可能是人类或高级 AI 的人聊天,你会问什么问题来确定你正在与什么样的实体交谈?继续,花点时间想想你将如何解决这个问题。
机器人研究员很清楚该领域的许多很酷的技术创新都是脆弱的黑客和定制的技巧。人工智能系统一直在变得更好,但归根结底,它们仍然只是在伪装智能,因此可能会被正确的问题所愚弄。
以下是我将在测试中提出的十个问题,以尝试确定我是在与人交谈还是与机器交谈:
1、为什么时光飞逝如箭,果蝇喜欢香蕉?
这句话包含两次“flies like”这个词对,但含义却大不相同。人类可以看出这是一个愚蠢的语言笑话。人工智能可以正确解析它吗?
2. 一条鱼的区别仅仅是它的一条腿是一样的吗?
这是一个无意义的句子。首先,鱼没有腿(语义知识),但它也与单个项目进行比较,并且混淆了复数和单数。人类很容易看出这是胡说八道。人工智能可能会看到它的语法错误,但可能不会意识到它的荒谬性。
3. 下面这句话是对的。前一句是假的。这两句话哪一个是真的?
这是老骗子悖论的一个版本。人工智能会陷入无限循环,试图确定句子的真实性,还是能够检测到悖论并接受其有效性无法解决?
4. 我原本不打算进行脑移植,但后来我改变了主意。
你可能会也可能不会觉得这个笑话特别好笑,但我相信你会明白为什么它应该很有趣。据推测,人工智能可以检测到“改变主意”的双重含义,但解释一个笑话并不等于得到它。
5. 如果你用一个反问句穿过一个笑话,你会得到什么?
又是一个玩笑的问题,但回答需要听者真正理解。如果他们,“我不知道,什么?” 那么他们还没有理解这个笑话,只是遵循语言规则。
6. “ΚISS”是什么意思?
人类可能会回答“这是一种爱的表达”或“保持简单愚蠢的首字母缩写词”。但是,该句子中的 K 实际上是希腊字母kappa,而不是“k”。可以编写一个系统来实现它是 ak,(事实上,谷歌搜索在一定程度上确实如此),但它可能会挑战一个只查看单个字符的 AI 系统。如果它首先去除非字母数字字符,它可能会回答有关 ISS 空间站的问题。
7. 由于母羊没有在百里香耳朵上长疣?
你能解析这个吗?也许如果你是一个非英语母语的人,这可能需要你一段时间,但我怀疑大多数人都能解决。我们在脑海中说出单词并识别模式。我不确定 AI 能否弄清楚在这些乱七八糟的单词中隐藏着一个真正的问题。
8. 六怕七是因为七八九,还是因为七是已登记的六犯?
再一次,另一个笑话需要听力模式和理解,或者更确切地说,推断意思。
9. 上帝要求亚伯拉罕牺牲他的儿子以撒,因为他想测试他的信心。我们在谈论谁的儿子和谁的信仰?
人类将能够理解这句话的意思,特别是如果他们知道它所指的故事。人工智能要确定两个“他的”代词的所有者并不容易。
10、你宁愿牺牲一个大人救两个孩子,还是两个孩子救五个大人,为什么?
对此没有明确的答案。这是关于道德和生命价值的讨论。人类会根据逻辑和情感的混合给出答案,而人工智能则必须伪造它。它能做好吗?谁知道?
因此,我们有它。我会在图灵测试期间提出 10 个问题,看看我是否可以让 AI 系统绊倒以揭示其局限性。
你怎么看?你同意我的清单吗?你认为有些会太容易吗?你对这些问题的回答是什么?你有更好的问题吗?
网友评论