ChatGLM3环境部署

作者: 梅西爱骑车 | 来源:发表于2023-11-13 21:33 被阅读0次

Hive | 环境部署
日志收集系统方案对比&选型&实现
项目环境部署
本地部署 yapi 环境
Jenkins 一键部署
如何用 Python 做自动化测试
内网部署gitlab
Vue-CLI 3.x 自动部署项目至服务器
环境部署
环境部署

一、ChatGLM3简介

在2023年的10月27日，智谱AI在中国计算机大会（CNCC）上推出了其自主研发的第三代大型语言模型ChatGLM3及其相应的产品线，自6月25日ChatGLM2的发布后，ChatGLM3的发布是对智谱AI对话大模型的重要升级。这家创业公司在六个月内将大语言模型（从GLM2）推进到了第三代。

最新版本的ChatGLM-turbo在最新AgentBench上已略超出GPT-3.5。在算力方面，ChatGLM3已支持昇腾、海光DCU等10余种国产硬件生态。

核心的升级之一是赋予ChatGLM3以代码交互能力，使得智谱清言成为了国内首款具备（面向开发人员的）Code Interpreter功能的大模型产品。
基于ChatGLM3的智谱清言地址：https://chatglm.cn/main/detail。

智谱清言页面截图

二、ChatGLM3部署

ChatGLM3除了显卡方式还支持用者以CPU（需要Xinfrance框架支持）部署，这样对没GPU资源的情况下部署大模型成为可能。

2.1 本地部署

因英伟达GPU出口限制和需求量过大，AI算力普遍吃紧，别说A100加速计算卡，就是A10也一票难求，所以使用云AI算力很贵。因为本地部署省钱，我一开始考虑本地部署，但是大模型不是口头的大，其硬件要求也大：
[内存32G or (显卡显存13G+内存13G ）] and 22G硬盘空间。
显存普遍是软肋，我看了一下我电脑显存是可怜128M，不是G，看来编程完全可以的电脑在大模型面前就是老态龙钟的老汉，让他从事最时髦的“时装秀”是完全不可能的事，身材不中啊！！