美文网首页
什么是大模型

什么是大模型

作者: 自天佑之吉无不利 | 来源:发表于2023-08-19 23:04 被阅读0次

实际上,在技术术语上并没有“大模型”这个说法。不过,由于它被广泛使用,大模型这个名字已经深入人心。

AI 专家们介绍了目前该类模型所面临的机遇和挑战,并一致将这些大模型称为基础模型(Foundation Models),所以通用的标准术语是基础模型而非大模型。

维基百科对基础模型的定义是这样的,基础模型是一种大型机器学习模型,通常在大量数据上进行大规模训练(通过自监督学习或半监督学习),以使它可以适应各类下游任务。因此,它需要兼顾参数量大(大型模型),训练数据量大(大量数据大规模训练)和迁移学习能力强(适应多种下游任务)几点才能够叫做基础模型,而不只是参数量大,就能够叫做基础模型。

所谓“涌现”,指的是在大模型领域,当模型突破某个规模时,性能显著提升,表现出让人惊艳、意想不到的能力。所谓思维链(Chain-of-thought,CoT)指的是通过一系列有逻辑关系的思考步骤,形成一个完整的思考,进而得出答案的过程。

此文章为8月Day19学习笔记,内容来源于极客时间《AI大模型系统实战 》,强烈推荐该课程

相关文章

  • 大模型的发展与解决的问题

    目前Foundation Model或者是大模型,特别地火,接下来介绍什么是大模型,大模型的基本概念;接着看看大模...

  • Decision trees for uplift modeli

    论文地址 :Decision Trees for Uplift Modeling 摘要 什么是uplift模型 大...

  • 语言模型

    什么是语言模型 语言模型建模方法分为 统计语言模型 和 规则语言模型 两大类,前者完全依靠大文本的数据,用统计的方...

  • 什么是模型?

    通过主观意识借助实体或者虚拟表现构成客观阐述形态结构的一种表达目的的物件(物件并不等于物体,不局限于实体与虚拟、不...

  • 路由器之QoS业务介绍

    本文目录 · 什么是QoS ·QoS 四大度量指标 ·QoS应用服务模型——DiffServ(差分服务)网络模型 ...

  • 2019-01-25

    认知(结构梳理) 时间管理的三大模型:原理,认知 ,应用三大模型。 一、认知是什么?现在的人更多的关注的是应用层,...

  • 战略钟模型【市场营销学战略连载(6)】

    什么是战略钟模型 战略钟模型的英文全称是“Bowman's Strategic Clock”,顾名思义,这是鲍曼大...

  • 学习思维模型,思考底层逻辑,你的人生会像开挂一般

    01 什么是思维模型?什么是底层逻辑? 1、什么是思维模型 在了解思维模型前,先了解一下什么是模型。 查理·芒格给...

  • 思维模型 | 什么是思维模型

  • 什么是“上瘾模型”?

    近期因为与增长黑客课程结缘,读了他们推荐的一本书 “上瘾:让用户养成使用习惯的四大产品逻辑”,该书试图描绘的是基于...

网友评论

      本文标题:什么是大模型

      本文链接:https://www.haomeiwen.com/subject/jdxsmdtx.html