bge embedding模型原理

bge embedding模型原理

作者: NazgulSun | 来源:发表于2023-09-16 20:23 被阅读0次

tensorflow2.3实战循环神经网络
模型部署
Word2vec bin文件转txt文件
补全模型ConvKB与CapsE调试
Keras-Embedding Layer
详解TF中的Embedding操作！
BiLSTM CRF 模型代码实践过程中的记录
Embedding 原理与代码实战
tf.nn.embedding_lookup函数原理？
rasa框架意图分类embedding算法

持续迭代的嵌入模型

论文： C-Pack： Packaged Resources To Advance General Chinese Embedding

测试效果看，比m3e,openai-ada 在中文各个任务测试集上的效果要好。
主要的几个特点：

自己重新训练了编码器，而不是用roberta这种，实验显示有效果提升，主要的预训练方式，就是对于句子A，加入一点噪音，变成A1, 然后通过预训练还原出来。
使用unlabel的1亿数据进行预训练，来自一些文本数据对，比如标题+段落。然后用一个相似度0.43的阈值做了一些清理。
使用了对比学习，in-batch的负样本采样，batchsize越大，效果越好。
使用80万label的数据，主要是搜索ranking等相关数据，进行微调，在搜索rank的任务上效果更好。
在label微调的时候，加入了指令来区分不同任务，比如说这是一个搜索任务，实验表明，去除这个hard instruction，效果也是下降的。
所以加入这些做法之后，训练了一个很成功的bge算法。

image.png

image.png

相关文章

tensorflow2.3实战循环神经网络
一：理论部分 embedding和变长输入处理序列式问题循环神经网络 LSTM模型原理二：实战 keras实...
模型部署
一、深度模型线上部署1、预训练embedding+轻量级模型复杂网络离线训练，生成embedding存入内存数据库...
Word2vec bin文件转txt文件
深度学习模型训练时，常常需要下载pretrained embedding，而embedding保存的格式常有.bi...
补全模型ConvKB与CapsE调试
模型一： Github: ConvKB论文: A Novel Embedding Model for Knowle...
Keras-Embedding Layer
Embedding Layer(嵌入层) Embedding Layer是使用在模型第一层的网络层,其目的是将所有...
详解TF中的Embedding操作！
embedding大家都不陌生，在我们的模型中，只要存在离散变量，那么一般都会用到embedding操作。今天这篇...
BiLSTM CRF 模型代码实践过程中的记录
1、一个适当的 embedding_size 可以加速模型的运行速度当将 embedding_size 的大小由...
Embedding 原理与代码实战
embedding 的原理 embedding 层做了个什么呢？它把我们的稀疏矩阵，通过一些线性变换（在CNN中用...
tf.nn.embedding_lookup函数原理？
可参考知乎的文章tf.nn.embedding_lookup函数原理？
rasa框架意图分类embedding算法
算法模型intent_classifier_tensorflow_embedding点击此处获取算法代码算法框架...

网友评论

本文标题：bge embedding模型原理

本文链接：https://www.haomeiwen.com/subject/nodivdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|bge embedding模型原理|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！