实际上,在技术术语上并没有“大模型”这个说法。不过,由于它被广泛使用,大模型这个名字已经深入人心。
AI 专家们介绍了目前该类模型所面临的机遇和挑战,并一致将这些大模型称为基础模型(Foundation Models),所以通用的标准术语是基础模型而非大模型。
维基百科对基础模型的定义是这样的,基础模型是一种大型机器学习模型,通常在大量数据上进行大规模训练(通过自监督学习或半监督学习),以使它可以适应各类下游任务。因此,它需要兼顾参数量大(大型模型),训练数据量大(大量数据大规模训练)和迁移学习能力强(适应多种下游任务)几点才能够叫做基础模型,而不只是参数量大,就能够叫做基础模型。
所谓“涌现”,指的是在大模型领域,当模型突破某个规模时,性能显著提升,表现出让人惊艳、意想不到的能力。所谓思维链(Chain-of-thought,CoT)指的是通过一系列有逻辑关系的思考步骤,形成一个完整的思考,进而得出答案的过程。
此文章为8月Day19学习笔记,内容来源于极客时间《AI大模型系统实战 》,强烈推荐该课程
网友评论