你要把表针拨回去,提出来的问题就会是:
为什么出风头的是绘图AI?绘图AI做对了什么?
为什么吸引话题的是游戏AI?游戏AI做对了什么?
为什么受关注的是语音识别AI?语音识别AI做对了什么?
为什么吸钱最多的是智能驾驶?智能驾驶AI做对了什么?
……
答案很简单:百花齐放。
现在,关于神经网络,人类尚处于探索阶段。
探索阶段的意思,就是没人知道该往哪个方向走,只能冥思苦想、然后选定一个方向探索下去。
每一个方向都是困难的,都会遭遇失败。没有人知道能不能成功,更没人知道该如何走向成功。
其实,GPT系列曾经是一个“错误”的方向。别人都在研究、定制针对某个任务最有效的AI;而它呢,就是大力出奇迹,动辄数亿个参数,玩命的跑训练……
跑训练并不是想象那么轻描淡写。
事实上,每次跑训练,都要总结之前的经验教训、找出法子避免AI像之前一样陷入局部最优;同时还要尽可能保留之前的、有效的阶段成果。
拿来训练的数据要标注,要删除一些可能会引偏AI的tag,这都需要训练有素的专业团队的海量努力——要知道,拿来训练的数据可是动辄上P的!
如此,一次训练,投入往往就要数千万美金。
跑完了,效果不理想,你知道为什么吗?
丢给数据团队,想方设法的分析、验证吧。
然后,提出新的理论,做出新的改进,再一次的标注/整理数据,再跑一次……
每一个方向都是如此。
如今,2023年2月~3月,ChatGPT爆火,仅仅是因为——其他途径要么早就成功了,要么早就放弃了。
只有它,盯着似乎不可能成功的“大力出奇迹”这条路,一口气跑到黑——前面说过,这曾经被认为是一种错误。
但,它真的摸到新领域了。
它的路子最独特、目标最远,所以成果自然更令人震惊——以至于很多人相信它真的有了智能。
但是,另一方面,我们可以看到,这些搞AI的公司,他们并不是各自为战。
事实上,每一家在某个方向有了突破,都会马上拿出来展示,写论文揭示思路;然后,这些思路会迅速扩散到其他AI……
比如说,我曾经提过,transformer(也就是GPT那个T)利用了注意力机制;而我之前曾经……不敢说学习,只能说关注过语音识别AI,而语音识别AI也用了注意力机制——没错,也是transformer。
当然,它们都不仅仅是transformer。可以说,其他所有AI研发中取得的经验,都被这些人综合起来、合理利用了。
ChatGPT之所以能够成功,并不仅仅是大力出奇迹、玩命训练海量参数的transformer就行的。
换句话说,或许,gpt-2甚至gpt-3时代,它的确是“错误的道路”;但,绘图、语音/语言/翻译、游戏……所有这些AI的成功一点点补全了它,拉近了它和成功之间的距离……
然后,在2023年2月这个时间点,它火了。
可以预见,在它的带动下,这个成功经验也会迅速被其他AI团队汲取。
就让我们等待下一次其他AI的闪耀吧。
在新事物出现的那一段时间,这种闪耀总是如此的此起彼伏;等AI这个领域大成的那一天,ChatGPT或许也会像当初研究物质波的德布罗意一样,变成不起眼的一朵小小浪花。
网友评论