美文网首页
【博文阅读笔记】LLM应用架构

【博文阅读笔记】LLM应用架构

作者: 啊阿伟啊 | 来源:发表于2023-11-18 12:31 被阅读0次

分类: 人工智能, 架构,LLM,大模型

原博:The architecture of today's LLM applications

一、构建LLM应用的5个步骤

https://github.blog/wp-content/uploads/2023/10/FivestepstobuildingLLMapp.png?resize=1022%2C537?w=1022

1. 确认问题

确认需要使用LLM解决的目标问题,问题规模要能够聚焦,可以快速迭代,但也要足够大,可以让用户惊叹。

2. 选择正确的模型

可以考虑的维度:

1)许可

2)模型的参数量

3)模型性能

3. 定制 LLM

有以下方法:

1)上下文学习(In-context learning)/ prompt 工程

2)人工反馈强化学习(RLHF)

3)微调(Fine-tuning)

4. 设计应用架构

可以分为3类:

1)用户输入:UI,LLM,托管平台

2)输入增强和 prompt 构建工具:数据源,embedding 模型,向量数据库,prompt 构建和优化工具,数据过滤器

3)高效且负责的 AI 工具:LLM 缓存,LLM 内容分类器或过滤器,评估 LLM 输出的遥测服务

5. 线上评估

评估用户真实交互过程中模型的性能和效果

二、LLM 应用架构

https://github.blog/wp-content/uploads/2023/10/LLMapparchitecturediagram.png?resize=3200%2C1700

1. 用户输入工具

1)LLM API 和服务

2)用户界面

3)语音识别工具:支持语音输入

2. 输入增强和 prompt 构建工具

输入增强工具,将用户输入丰富上下文并组装成模型输入,有以下工具:

1)向量数据库

2)embedding 模型

3)数据过滤器:确保 LLM 不会处理未授权的数据,比如个人身份信息

4)prompt 优化工具:通过 prompt 工程组合上下文信息和用户的输入,找到一种可以让 LLM 可以生成与用户输入最相关的结果

3. 高效且负责人的 AI 工具

1)LLM 缓存库:从缓存中找到类似查询的输出,避免重复生成,可以减少演示、计算成本

2)内容分类器或者过滤器:防止生成有害或者冒犯行的结果

3)遥测服务:根据用户实际的使用情况,评估应用的表现。

相关文章

网友评论

      本文标题:【博文阅读笔记】LLM应用架构

      本文链接:https://www.haomeiwen.com/subject/yzauwdtx.html