美文网首页AIGC&ChatGPT
大模型中知识库的工作原理 - 向量检索为核心的 RAG 架构

大模型中知识库的工作原理 - 向量检索为核心的 RAG 架构

作者: 求知笔记 | 来源:发表于2023-12-12 13:14 被阅读0次

大模型中知识库的工作原理

我们为什么要接入知识库呢?
我们可以把大模型比做是一个超级专家,他熟悉人类各个领域的知识,但他也有自己的局限性,比如他不知道你个人的一些状况,因为这些信息是你私人的,不会在互联网上公开,所以他没有提前学习的机会。
当你想雇佣这个超级专家来充当你的家庭财务顾问时,需要允许他在接受你的提问时先翻看一下你的投资理财记录、家庭消费支出等数据。这样他才能根据你个人的实际情况提供专业的建议。
目前,向量检索为核心的 RAG 架构已成为解决大模型获取最新外部知识,同时解决其生成幻觉问题时的主流技术框架,并且已在相当多的应用场景中落地实践。

RAG 系统所做的事情:帮助大模型临时性地获得他所不具备的外部知识,允许它在回答问题之前先找答案。

开发者可以利用该技术低成本地构建一个 AI 智能客服、企业智能知识库、AI 搜索引擎等,通过自然语言输入与各类知识组织形式进行对话。以一个有代表性的 RAG 应用为例:
在下图中,当用户提问时 “美国总统是谁?” 时,系统并不是将问题直接交给大模型来回答,而是先将用户问题在知识库中(如下图中的维基百科)进行向量搜索,通过语义相似度匹配的方式查询到相关的内容(拜登是美国现任第46届总统…),然后再将用户问题和搜索到的相关知识提供给大模型,使得大模型获得足够完备的知识来回答问题,以此获得更可靠的问答结果。



根据上面这个例子,我们很容易发现 RAG 系统中最核心是外部知识的检索环节。专家能不能向你提供专业的家庭财务建议,取决于能不能精确找到他需要的信息,如果他找到的不是投资理财记录,而是家庭减肥计划,那再厉害的专家都会无能为力。

相关文章

  • netty 线程模型(未完成)

    参考 Netty原理架构解析 netty 入门 netty工作原理架构图+ 虽然Netty的线程模型基于主从Rea...

  • 《让未来现在就来》| 学会自主学习

    自主学习主要掌握5个核心能力: 检索能力。也就是搜索能力,可以分成网络检索和自己的知识库检索。用印象笔记构建自己的...

  • NLP的应用

    1 信息摘要 2 机器翻译 3 统计型机器翻译 4 信息检索 布尔检索向量空间模型概率模型 5 语音识别 6 文本...

  • 基于LDA主题模型的短文本分类

    VSM(向量空间模型)是信息检索领域最为经典的分析模型之一,采用VSM对短文本进行建模,即将每一篇短文本表示为向...

  • 阅读信息检索综述相关文献总结

    1.本体知识库的语义检索 2.本体知识库构建 1).获取相关数据,提取核心内容,标注,获得样本 2).建立领域本体...

  • 2018-05-02 第五周

    CNN模型搭建(二) 继续上周未完成的工作: # 为400维的输入向量占位,在CNN中为20 * 20的矩阵xs ...

  • 知识表示学习

    目的:学习出知识库中实体和关系的低维的稠密的向量 深度学习方法 SE模型 该公式衡量了在k关系下头实体和尾部实体的...

  • scala基础语法

    Spark核心编程wordcount程序原理深度剖析图 Spark核心编程Spark架构原理

  • 深度学习推荐系统之DeepCrossing

    DeepCrossing模型原理 这个模型就是一个真正的把深度学习架构应用于推荐系统中的模型了, 2016年由微软...

  • 实现TopK问题的三种算法

    在检索类的应用中往往实现TopK的应用,比如特征检索场景下,要对一个向量进行距离查询,输出距离最近的前10个向量。...

网友评论

    本文标题:大模型中知识库的工作原理 - 向量检索为核心的 RAG 架构

    本文链接:https://www.haomeiwen.com/subject/pyyvgdtx.html