GPT-2，吓坏创造者的「深度造假写手」

作者: 极小光 | 来源:发表于2019-05-15 10:06 被阅读16次

GPT-2，吓坏创造者的「深度造假写手」
深度阅读—洋葱阅第四周复盘
《deep learning》前两周课程总结
底层写手，你为什么还在写
GPT-2语言模型
配置BERT运行环境
三种网络写手，你是哪一种？
金钱确认词
毕业一年 -- 不再是少年
生活进展中∣献词

简评： 今年二月份刷屏的 GPT-2 着实厉害，那个生成续写故事的例子更是效果好到吓人一跳，它到底有多厉害，本文略微讲讲。更详细的信息可参考文末 OpenAI 的博客链接。

你能从下面这两段文字里品味出什么区别？

「四月间，天气寒冷晴朗，钟敲了十三下。」
「我坐在小汽车里，前往西雅图开始一份新工作。给车加油，插入钥匙，让它自己开。我沉入冥思，想象这会是怎样的一天。」

第一段文字，是英国著名作家乔治·奥维尔（George Orwell）的传世经典，政治荒诞讽刺小说《1984》开篇第一句话。

第二段文字，则是将第一段文字输入 GPT-2 程序后，这个 AI 系统的自动续写。

仅仅输入这么简单的一句话，GPT-2 显然就精确的抓住了乔治·奥维尔《1984》的荒诞、压抑、恐惧和反乌托邦的笔调，洋洋洒洒的续写起来：

一百年后，2045 年，我在中国一个贫穷农村地区的一所中学教书。我先开始教的是中国历史和中国科技史......

英国著名作家乔治·奥维尔（George Orwell）

▎「深度造假」

GPT-2 人工智能文字编写程序可以写小说、新闻、发言稿，还可以发短信推文。

程序开发者给它起了个绰号 —— 深度造假文字（deepfakes for text），精确地概括了它的功能。简而言之，GPT-2 就是一个文字发生器。你可以文字输入这个 AI 系统，只言片语或者大段文字都行，之后程序会根据自己的判断，决定接下来应该如何写作。

它产生的文字，从质量到数量到适应范围，都远远超出了设计者的预期。

它的「造假能力」如此令人信服，以至于其所属公司 Open AI 做出了一个不同寻常的决定：暂不公开 GPT-2 的技术信息，以免该技术被恶意使用。

▎以假乱真

与其它类似功能的程序相比，GPT-2 几乎不露马脚，比如写着写着忘了在写什么，或夹杂一些莫名其妙的词汇等。

英国《卫报》记者把英国脱欧的一些标题词汇输入 GPT-2，它写出了这样的一段「新闻稿」：

当被要求对有关报道做出澄清时，梅首相的发言人说：“首相已经明确表明，她要做的是尽快完成脱欧，这在上周的女王年度施政讲话中有明确授权。”

OpenAI 的研究负责人阿莫迪（Dario Amodei）对《卫报》说，GPT-2 从两个方面具有革命性的突破 —— 一是它的数据储藏能力巨大，是现有最前沿的 AI 文字发生器数据储量的 12 倍。这使得它能更好地理解掌握写作文风，笔法和意图。这也导致了它的第二个突破，即它的写作质量和应用的广泛性。

而也正是它生产出的文字达到了真假难辨的程度，也促使 OpenAI 公司决定暂时不公开 GPT-2 的技术。他们下一步将测试使用 GPT-2 可能出现的任何结果，以及如何防止恶意使用。

公司表示，使用 AI 技术的道德原则是一个全新的领域，他们还在探索之中。