美文网首页
Day 25 - 多模态检索

Day 25 - 多模态检索

作者: SunJi_ | 来源:发表于2022-04-25 09:32 被阅读0次

To do list

  • 参数实际值 + 半功率角相关的实验
  • 大规模搜索的详细报告
  • 背单词
  • u盘 + 书签 + 数据线 + 电子产品周边

eBay eProduct Visual Search Challenge - FGVC9 (CVPR2022)

任务要求:
To retrieve the “same products'' (see below) from a million-scale product database given a “query” image.

根据query集去在测试集(只有图片)中进行检索,获得你认为的匹配度高的检索rank。

数据集:
eProduct, a dataset consisting of 2.5 million product images towards accelerating development in the areas of self-supervised learning, weakly-supervised learning, and multimodal learning, for fine-grained recognition.

  • training set
    1.3M+ listing images, with titles and hierarchical category labels
  • evaluation set
    5K query and 1.1M+ index images

训练集,验证集,query集以及用于检索的数据库(测试集)

数据集样例 训练数据格式

提交要求:

  • 训练阶段(3.1-5.16)10/day、200/month
  • 测试阶段(5.16-5.30)5/day、50/month
  1. csv格式提交最终结果
  2. 无表头两列表格,第二列空格隔开产品序列号
提交样式

评价标准:
macro-average recall@k (MAR@k) is simply the average of recall@k over all queries, where k=10. And recall@k is the proportion of true match items found in the top-k recommendations.

Tips:

  • 计算只需要Top10的准确率,后面的序列不计入结果
  • 提取物体特征时,为了找到匹配度高的产品图,需要考虑同一产品在不同角度和不同背景下的图片,以及需要具有相同的颜色、样式和形状。产品的品质则不在区分条件中,例如新旧。

2021方法论

  • pseudo label + non-ensemble 文本特征提取
  • ensemble
  • larger image size

图像检索技术:

  1. 利用机器学习算法来提取特征,然后通过K近邻来寻找高匹配度产品。

文本与图像多模态的检索

  • 提取图像特征
  • 提取文本特征
  • 特征融合
  • KNN找出匹配度高的商品图

图像文本融合模型

  • TF-IDF 与 ResNet 取并集
  • SBERT 与 NFNet 取并集
  • TF-IDF 与 ResNet 度量层输出融合
  • SBERT 与 NFNet 度量层输出融合
  • 图像 Ensemble 与 文本 Ensemble 取并集

书签x3 + 冰墩墩x3 + 雪融融x1
预售抢不到,放弃了。

相关文章

网友评论

      本文标题:Day 25 - 多模态检索

      本文链接:https://www.haomeiwen.com/subject/pkftyrtx.html