美文网首页
从硬件角度看大语言模型落地的候选路径

从硬件角度看大语言模型落地的候选路径

作者: 黄军雷 | 来源:发表于2024-02-18 17:53 被阅读0次

从硬件角度来看,候选路径主要有以下几种:

第一种是最传统的方案,即自行购买GPU服务器并搭建底层硬件框架。在这种情况下,你有两种选择:一是选择英伟达的GPU相关服务器,或者选择华为的GPU服务器。

第二种选择仍是自行搭建服务器,但不是购买成型的服务器,而是自己根据需求来组装服务器,比如购买特定的显卡,根据需要去定制服务器。

第三种方式是在阿里云、华为云等云服务厂商处租用GPU服务器。这种方法的优点在于无需关注服务器硬件维护,可专注于大语言模型本身的技术研究。

第四种方式可能由于预算有限,需要压缩成本。此时,你可以选择传统的CPU服务器来搭建,并采用量化的模型,虽然降低了精度,但降低对显卡的需求。

第五种方法则是利用厂商的平台进行构建,他们已经完成了基本的架构。这样你只需要部署自己的模型就可以了。

第六种方式则是直接调用厂商的大语言模型接口,自己完成相关的知识库建设、接口应用和应用层开发。

最后一种方法是土豪级的,如OpenAI最近的新闻,他们要研发自己的GPU。这样的话他们从底层技术上是完全自主可控,而且能够更好的适应自己对于大模型技术的需求。

相关文章

  • 在地址栏输入www.google.com到返回页面都经历了什么?

    路径 硬件角度 网络安全角度 后端角度 前端角度科普,用最简洁的语言说明复杂的原理。 硬件角度 输入到识别 每次输...

  • 高效并发

    从JVM的角度看一下Java与线程,内存模型,线程安全以及JVM对于锁的优化 硬件内存模型与JVM内存模型 硬件的...

  • 从语言学角度看词嵌入模型

    本文为 AI 研习社编译的技术博客,原标题 : Moving beyond the distributional ...

  • 从语言的角度看世界

    今年回到家乡后,日常走在大街上会看到有些地方贴的有地方方言的图画,偶尔也会心里默念一下并想象下符合的场景,倍感亲切...

  • 选训育&用留

    选:了解设定岗位胜任力模型,从模型各个角度去衡量候选人的适合程度 训:训练四步骤、教授技能 用&育:知人善用,适才...

  • 分布估计算法简单介绍

    分布估计算法通过概率模型来描述候选解在空间中的分布,采用统计学的手段,从群体宏观的角度建立一个描述解分布的概率模型...

  • 计算机是如何工作的

    冯诺依曼体系结构,就是指存储程序计算机工作模型,计算机系统最最基础性的逻辑结构 从 硬件的角度 看: CPU中有一...

  • 计网体系结构 - 组成与分类

    01 组成 从组成部分的角度看,计算机网络由硬件、软件和协议组成,软件运行在硬件上,通过协议,不同的硬件实现互联互...

  • 从java的角度看golang并发(web server方面)

    从java的角度看golang在并发方面的特点,先从最顶层的线程模型开始,结合线程模型看golang的并发优势,最...

  • 从多核硬件架构,看Java内存模型

    在了解Java内存模型之前,先来看一下多核硬件架构。 我们应该都知道,计算机在执行程序的时候,每条指令都是在CPU...

网友评论

      本文标题:从硬件角度看大语言模型落地的候选路径

      本文链接:https://www.haomeiwen.com/subject/kddmadtx.html