RAG 学习笔记（二）

RAG 学习笔记（二）

作者: 啊阿伟啊 | 来源:发表于2024-01-07 19:41 被阅读0次

每天为你介绍一个时尚品牌~Rag & Bone
JavaScript学习笔记二
MySQL 学习实践笔记（四）
MySQL 学习实践笔记（三）
MySQL 学习实践笔记（二）
MySQL 学习实践笔记（一）
Skin
Discovery of an Active RAG Trans
没人会告诉你的职业忠告-上
【Objective-c】_蓝牙开发

基于博文 Advanced RAG Techniques: an Illustrated Overview 的学习和练习的记录。

中文内容可以查看博主@宝玉的译文高级 RAG 技术：图解概览 [译]

系列笔记：
RAG 学习笔记（一）

高级 RAG

高级 RAG 架构如下图所示

高级 RAG 架构

图中，绿色元素为 RAG 核心技术点，蓝色元素为文本。（本架构图对一些细节进行省略，不宜按照本图进行实施）

RAG 核心技术点

分块和矢量化
搜索索引构建
重排序和过滤
查询转换
聊天引擎
查询路由
RAG 中的 Agent
响应合成

下面将详细说明个技术点

分块和向量化

分块

文档分块的原因：

Transformer 模型输入的长度是固定的，能够表达的语义信息也是固定的，粒度小的文本内容（一句话或者几句话），生成的向量更能够表达文本的含义。

分块的大小是需要考量的参数。

影响因素：模型的选择，及模型 token 的容量。比如 Bert-based Sentence Transforms 模型最可以有 512 个token，而 OpenAI ada-002 可以接受 8191 个token。
需要在“获取到足够的上下文信息以供 LLM 生成回答”和“确保文本嵌入足够具体，以便有效地执行检索”之间找到平衡

扩展内容：

选择块大小时的各种考虑因素 Chunking Strategies for LLM Applications
LlamaIndex 中对于文本分块的实现 NodeParser class

向量化

将文本块转化成向量的过程就是 Embedding。

可以从榜单 MTEB leaderboard 找到最新、效果最好的 Embedding 模型。

作者推荐查询优化过（search optimized）的模型，比如 bge-large 、E5 embedding 系列模型。

实例

LlamaIndex 分块和向量化过程的样例：Ingestion Pipeline

相关文章

每天为你介绍一个时尚品牌~Rag & Bone
瑞格布恩（Rag & Bone）取自英国俗语“拾荒人”(Rag and Bone Man)，“收集没有人想要的东西...
JavaScript学习笔记二
JavaScript学习笔记二个人学习笔记参考阮一峰的JavaScript教学学习笔记二是对学习笔记一的补充 J...
MySQL 学习实践笔记（四）
MySQL 学习实践系列 MySQL 学习实践笔记（一） MySQL 学习实践笔记（二） MySQL 学习实践笔记...
MySQL 学习实践笔记（三）
MySQL 学习实践系列 MySQL 学习实践笔记（一） MySQL 学习实践笔记（二） MySQL 学习实践笔记...
MySQL 学习实践笔记（二）
MySQL 学习实践系列 MySQL 学习实践笔记（一） MySQL 学习实践笔记（二） MySQL 学习实践笔记...
MySQL 学习实践笔记（一）
MySQL 学习实践系列 MySQL 学习实践笔记（一） MySQL 学习实践笔记（二） MySQL 学习实践笔记...
Skin
Singer: Rag'N'Bone Man 歌词 When I heard that sound，脑海里仿佛有声...
Discovery of an Active RAG Trans
Result 2 TSD and TIR Structures of ProtoRAG 事实上，这一段并没有写什么...
没人会告诉你的职业忠告-上
Career Advice No One Tells You（1） | 没人会告诉你的职业忠告-上 By: Rag...
【Objective-c】_蓝牙开发
ios蓝牙开发学习笔记（一）蓝牙概述 ios蓝牙开发学习笔记（二）central角色的实现 ios蓝牙开发学习笔记...

网友评论

本文标题：RAG 学习笔记（二）

本文链接：https://www.haomeiwen.com/subject/xvqgndtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|RAG 学习笔记（二）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！