Meta在训练LLaMA3 70b的时候提到,这个模型甚至还没有在整个数据集上完全收敛。最近问了计算机领域的自动机算法,发现LLaMA3 8b 模型居然也懂不少。不得不说,模型的潜力还是很大的。
其实我们每个人也很想是一个在互联网这个巨大的数据库中不断训练,追求收敛的模型。学出来就对应着模型收敛。没有学出来也可能发散,再训练效果也不好。人都有着这样的潜力,至少是可能性。
Meta在训练LLaMA3 70b的时候提到,这个模型甚至还没有在整个数据集上完全收敛。最近问了计算机领域的自动机算法,发现LLaMA3 8b 模型居然也懂不少。不得不说,模型的潜力还是很大的。
其实我们每个人也很想是一个在互联网这个巨大的数据库中不断训练,追求收敛的模型。学出来就对应着模型收敛。没有学出来也可能发散,再训练效果也不好。人都有着这样的潜力,至少是可能性。
本文标题:人的学习过程和大模型训练过程有着相似之处
本文链接:https://www.haomeiwen.com/subject/zgbdqjtx.html
网友评论