ChatGPT之前堪称石破天惊的AI产品是deepmind的AlphaGo。今天想起来,二者还是很像的。
击败李世石的初代AlphaGo,还依赖人类历史上的围棋棋谱为数据集,其后产品AlphaGoZero则彻底摆脱了人类数据,实现了自学习从零开始。
相比而言,ChatGPT基于人工反馈的强化学习方法对模型进一步进行微调,要更加困难。因为AlphaGo的微调是用胜率当做标尺衡量判断,而ChatGPT还离不开人工反馈,否则就如《流浪地球2》中马兆所说:没有人类的文明,毫无意义。
ChatGPT的问世,如同人类打开了潘多拉的盒子。但这已经不可逆的,绝对没有回头路。
网友评论