【博文阅读笔记】LLM应用架构

作者: 啊阿伟啊 | 来源:发表于2023-11-18 12:31 被阅读0次

架构系列博文
应用架构文章
SpringMVC 学习笔记
Go基础 - 6 模板应用
架构的一些记录
架构阅读笔记
DEC培训Day-1：应用架构
iOS应用架构谈开篇
2019-02-20 分布式服务框架原理与实践
【教书匠阿伦-外刊精读】美国法学院，总统和大法官的摇篮

分类: 人工智能, 架构，LLM，大模型

原博：The architecture of today's LLM applications

一、构建LLM应用的5个步骤

https://github.blog/wp-content/uploads/2023/10/FivestepstobuildingLLMapp.png?resize=1022%2C537?w=1022

1. 确认问题

确认需要使用LLM解决的目标问题，问题规模要能够聚焦，可以快速迭代，但也要足够大，可以让用户惊叹。

经验借鉴：GitHub Copilot 经验

2. 选择正确的模型

可以考虑的维度：

1）许可

2）模型的参数量

3）模型性能

3. 定制 LLM

有以下方法：

1）上下文学习（In-context learning）/ prompt 工程

2）人工反馈强化学习（RLHF）

3）微调（Fine-tuning）

4. 设计应用架构

可以分为3类：

1）用户输入：UI，LLM，托管平台

2）输入增强和 prompt 构建工具：数据源，embedding 模型，向量数据库，prompt 构建和优化工具，数据过滤器

3）高效且负责的 AI 工具：LLM 缓存，LLM 内容分类器或过滤器，评估 LLM 输出的遥测服务

5. 线上评估

评估用户真实交互过程中模型的性能和效果

二、LLM 应用架构

https://github.blog/wp-content/uploads/2023/10/LLMapparchitecturediagram.png?resize=3200%2C1700

1. 用户输入工具

1）LLM API 和服务

2）用户界面

3）语音识别工具：支持语音输入

2. 输入增强和 prompt 构建工具

输入增强工具，将用户输入丰富上下文并组装成模型输入，有以下工具：

1）向量数据库

2）embedding 模型

3）数据过滤器：确保 LLM 不会处理未授权的数据，比如个人身份信息

相关工具：amoffat/HeimdaLLM

4）prompt 优化工具：通过 prompt 工程组合上下文信息和用户的输入，找到一种可以让 LLM 可以生成与用户输入最相关的结果

相关工具：langchain-ai/langchain

3. 高效且负责人的 AI 工具

1）LLM 缓存库：从缓存中找到类似查询的输出，避免重复生成，可以减少演示、计算成本

相关工具：zilliztech/GPTcache

2）内容分类器或者过滤器：防止生成有害或者冒犯行的结果

相关工具：derwiki/llm-prompt-injection-filtering，laiyer-ai/llm-guard

3）遥测服务：根据用户实际的使用情况，评估应用的表现。

相关工具：OpenTelemetry
经验借鉴：how GitHub uses OpenTelemetry

网友评论

本文标题：【博文阅读笔记】LLM应用架构

本文链接：https://www.haomeiwen.com/subject/yzauwdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

【博文阅读笔记】LLM应用架构

一、构建LLM应用的5个步骤

1. 确认问题

2. 选择正确的模型

3. 定制 LLM

4. 设计应用架构

5. 线上评估

二、LLM 应用架构

1. 用户输入工具

2. 输入增强和 prompt 构建工具

3. 高效且负责人的 AI 工具

相关文章

架构系列博文

应用架构文章

SpringMVC 学习笔记

Go基础 - 6 模板应用

架构的一些记录

架构阅读笔记

DEC培训Day-1：应用架构

iOS应用架构谈开篇

2019-02-20 分布式服务框架原理与实践

【教书匠阿伦-外刊精读】美国法学院，总统和大法官的摇篮

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读