美文网首页
AltCLIP:更改CLIP中的语言编码器以实现扩展语言功能

AltCLIP:更改CLIP中的语言编码器以实现扩展语言功能

作者: Valar_Morghulis | 来源:发表于2023-02-27 09:37 被阅读0次

AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities

Nov 2022

https://arxiv.org/abs/2211.06679

https://github.com/flagai-open/flagai

在这项工作中,我们提出了一种概念上简单有效的方法来训练强大的双语/多语言多模态表示模型。从OpenAI发布的预先训练的多模态表示模型CLIP开始,我们用预先训练的多语文本编码器XLM-R改变了其文本编码器,并通过由教师学习和对比学习组成的两阶段训练模式来对齐语言和图像表示。我们通过对大量任务的评估来验证我们的方法。我们为一系列任务设置了最先进的性能,包括ImageNet CN、Flicker30k CN、COCO-CN和XTD。此外,我们在几乎所有任务上都获得了与CLIP非常接近的性能,这表明我们可以简单地更改CLIP中的文本编码器,以获得扩展功能,如多语言理解。我们的型号和代码可在https://github.com/FlagAI-Open/FlagAI.

In this work, we present a conceptually simple and effective method to train a strong bilingual/multilingual multimodal representation model. Starting from the pre-trained multimodal representation model CLIP released by OpenAI, we altered its text encoder with a pre-trained multilingual text encoder XLM-R, and aligned both languages and image representations by a two-stage training schema consisting of teacher learning and contrastive learning. We validate our method through evaluations of a wide range of tasks. We set new state-of-the-art performances on a bunch of tasks including ImageNet-CN, Flicker30k-CN, COCO-CN and XTD. Further, we obtain very close performances with CLIP on almost all tasks, suggesting that one can simply alter the text encoder in CLIP for extended capabilities such as multilingual understanding. Our models and code are available at https://github.com/FlagAI-Open/FlagAI.

相关文章

  • 深入 Block

    Block 前言 Block是OC中对C语言的扩展功能,是一种带有自动变量的匿名函数,Block在OC中的实现,点...

  • block详解

    block是苹果为C语言的扩展的新功能,非标准功能,类似其他语言的闭包。block就是把可执行代码和代码中可以访问...

  • Lua语言学习(一)

    Lua语言:轻量脚本语言,多作为功能扩展使用,标准C语言编写,可扩展性高,支持面向过程编程和面向函数编程。本文主要...

  • Scala教程之:可扩展的scala

    Scala是扩展的,Scala提供了一种独特的语言机制来实现这种功能: 隐式类: 允许给已有的类型添加扩展方法 字...

  • 7.SpringAop之声明式Aop基于配置:AspectJAw

    介绍 AspectJ项目是对java语言面向切面编程的一个扩展,Spring框架实现了AspectJ的部分功能。A...

  • Res----values.Strings初步认识

    目录 用途 应用国际化,随系统语言设置,更改当前语言 使用方式 xml java 国际化 根据语言偏好设置更改,中...

  • CLIP-Adapter: Better Vision-Lang

    对比语言图像预训练(CLIP) 虽然prompt-tuning用于textual inputs,但是建议CLIP ...

  • IDC

    ida中的idc作为类似c语言的脚本语言,非常好用。使用学习方法参考。ida权威指南-扩展ida的功能 写段代码,...

  • 易语言扩展插件

    易语言扩展插件1.25版 这是什么 用于加强易语言的代码编写功能,易语言er的福音。 智能变量仅支持易语言5.7版...

  • XML

    XML: 概念:Extensible Markup Language 可扩展标记语言可扩展:标签都是自定义的。功能...

网友评论

      本文标题:AltCLIP:更改CLIP中的语言编码器以实现扩展语言功能

      本文链接:https://www.haomeiwen.com/subject/iamzkdtx.html