聊一聊无所不能的人工智能ChatGPT

作者: 江心雨亭 | 来源:发表于2023-02-17 00:01 被阅读0次

聊一聊无所不能的人工智能ChatGPT
MOSS 真的要来了吗？——ChatGPT
「干货」2018你最应该学习的硬技能（零基础大数据入门）
关于未来——与朋友聊chatGPT
程序猿跟你聊聊人工智能
聊一聊
聊一聊
聊一聊
聊一聊
聊一聊

郑重声明：本文系原创首发，文责自负。

最近人工智能比较火,其中ChatGPT是大家谈论最多的。有一个孩子的家长，为了提高上初中孩子的英语水平。将一册书的全部英语单词汇集在一起，由ChatGPT生成了一篇文章。孩子通过学习，成绩满分。只是一篇英文文章，就涵盖了一本书的内容。还是很让人震惊的。还有程序员，要求的一些代码，可以拿来直接使用，省时省力。

难怪这么多人追捧。

那么什么是ChatGPT。我也查阅了一些资料，也登陆了网站。很遗憾，目前国内的手机无法注册。

关于这个话题,我给大家普及一下,ChatGPT的技术起源，以及这款AI聊天机器人背后的核心技术是什么。

首先我们以一种易于理解的方式，去拆解一下GPT三个字，GPT的全称是：Generative、Pre-trained、Transformer。中文翻译是：“生成性预训练变换模型”。那我们一个一个字母来看，第1个字母G,翻译过来就是“生成性”。所以我们称ChatGPT是生成性人工智能，也就是所谓的生成性AI。

在此之前呢，人工智能机器学习，在很大程度上都是局限于观察分析和分类内容。一个经典的机器学习的例子，就是图像识别。比如说让机器去识别一只狗,那程序就会仔细地去搜索和分析大量的图像,去寻找与狗匹配的图像。而以GPT代表的生成性AI，是一项技术上的突破，它是可以去生成新内容，而不是仅限于分析现有的数据的一种AI。它可以根据我们的需要，去创建一个狗的图像，或者生成文本描述。明白了吧，多了一个生成性AI模型。这就是进步，说起来简单，实际上是非常复杂的。那生成性AI模型呢。也可以用于去生成程序代码、诗歌、文章、艺术品等等。

最新发布的ChatGPT，是专注于文本内容的生成，那未来应该也会有图像、艺术等各种形式的生存性AI。尽管应用领域不同，但是它的技术核心是类似的。也就是说所谓的生成性的人工智能。

那GPT的第2个字母是P，他表示这个模型，已经在某些有限的数据集上进行了训练。就像我们在被要求回答某个问题之前，我们会事先去阅读一些相关的书籍一样。ChatGPT之所以能够听起来像人一样来回答我们的问题。就是因为它已经接受过大量数据地训练。

而这些数据呢，是由我们真实的人来编写的。也就是说，是我们人类发布在互联网上的，这样看来，它应该包括了所有2022年以前的互联网上的内容。

那么怎么去进行预训练呢，它使用的是两项技术。一个叫监督学习，另一个通过人类反馈强化学习。

这个听起来比较专业，我举个通俗的例子，来帮助大家理解。请你想象一个场景，老师要教学生写一篇文章。那监督学习呢，相当于老师在让学生写文章之前，先给学生成千上万篇文章让他们阅读，这不可能，只是举个例子。那这个目标就是，让学生通过学习大量论文的语气、词汇和结构。去学习如何写一篇文章。这就是预训练里面的监督学习。

但是那些文章会有好有坏，学生如果参考不好的范文，仍然有可能写出不符合，不合格的文章，不符合老师要求的文章。

这个时候就用到第二项技术，就是通过人类反馈强化学习。也就是说老师，还会经常给学生去布置一些作业。然后根据学生交上来的作业去进行反馈，告诉学生，哪些地方做得好，哪些地方需要改进。那么在这个反馈的过程中。去进一步强化学生的写作水平。

所以在GPT发布之前，已经用类似的方法进行了大量的监督学习，和通过人类反馈强化学习。所以我们在使用它的时候，这个模型，也就是这个超人，它能非常准确快速的去生成连贯，富有教养的，而且是引人入胜的回答。听起来像人类的一个响应。这就像是一个饱读诗书功力深厚的学者，被要求现场写文章，他能够一气呵成去完成一样。可以想像一下，李白、杜甫这样的诗仙诗圣写诗一样。我估计，它写出来没那么好吧，没那么经典吧。成诗是没问题的，我有时，诗兴大发时，还能写上两句，人人都能写。

那么GPT第3个字母那就是T，是Transformer。如果你直接翻译过来了，就是转换器或者是变形金刚。有一部电影叫变形金刚，就叫Transformer。如果你把Transformer翻译成转换器或者变形金刚，那就不对了。

它真正的含义的是一个非常底层的人工智能，机器学习的一个算法架构，它是一种深度神经网络，最初这个架构是在2017年，由谷歌的一个人工智能的团队研发的，就是谷歌大脑。

这团队发布的这种模型，它是使用一种叫“自注意力”的机制。它允许模型在进行预测的时候，可以根据语言序列的任何位置，为输入数据的不同部分，赋予不同的权重，并支持处理更大的数据集。

现在所有的GPT模型都是采用了这种架构，他们会有一个编码器，来处理输入的序列，然后会有一个解码器来生成输出的序列。所以你可以问他一个问题，他会用对话的方式来提供给你答案。而不是像传统的搜索引擎那样，扔给你一堆信息源，让你自己去筛选。从一众垃圾中自行筛选。

那这三个字母拼在一起就是GPT。

说了这么些，大家应该有些了解吧。当然，有些太专业，好多我也不太明白，太专业了。

ChatGPT火起来之后，很多人都争相效仿，出现了大量的伪人工智能，目的就是吸引人们的眼球。最不要脸，当数国内某些平台发布的一些劣质聊天机器人，声称如何，如何。要多恶心就多恶心。要多低能就多低能。人家发展到目前阶段，也只是个初级阶段。前面还经历了GPT－1，GPT－2.这也只是GPT－3，未来还有很长的路，毕竟，也只是在文档上略显功力。

也有很多人吐槽回答很弱智，即使集人间知识大成于一体，也难免会有疏漏。

还有一个现像，很引人观注，对于它的提问，我都不知道该用哪个他了。它会看人回答问题，比如用中文问问题的，用英文问的，它可以区别回答。就是中文，用简体字和繁体字提问，它的回答都不一样。完全像是一个有思想的超人。

另外，它写文章是超棒的，这篇文章可能就是他写的。当然，里面有错别字的话，那是我故意改的，让别人觉得是我写的。