美文网首页
2024-03-20 简讯 : IBM 和 NASA 构建语言模

2024-03-20 简讯 : IBM 和 NASA 构建语言模

作者: 数科每日 | 来源:发表于2024-03-20 21:45 被阅读0次

头条


Inflection 联合创始人离职前往微软 AI

https://inflection.ai/the-new-inflection
Mustafa Suleyman 和 Karén Simonyan 将离开 Inflection 创办 Microsoft AI。 肖恩·怀特 (Sean White) 加入,担任新任首席执行官。 Inflection 的一些高级团队成员也将加入 Microsoft AI。

Lilac 被 Databricks 收购

https://www.databricks.com/blog/lilac-joins-databricks-simplify-unstructured-data-evaluation-generative-ai
Lilac 加入 Databricks 继续构建其用于无监督语言数据集构建的系统。

IBM 和 NASA 构建语言模型,让科学知识更容易获取

https://research.ibm.com/blog/science-expert-LLM
IBM 和 NASA 之间的合作开发了基于 Transformer 的高级语言模型,该模型经过科学文献训练,以提高科学领域内自然语言理解任务的性能。 这些模型在 Hugging Face 上开源。


研究


深入探究:SORA 的幕后工作原理

https://factorialfunds.com/blog/under-the-hood-how-openai-s-sora-model-works
前 OpenAI 科学家发表的一篇关于 Sora 以及生成视频的潜在成本的文章。

RAG 2.0

https://contextual.ai/introducing-rag2/
检索增强生成(RAG)是一种将知识注入可能过时的语言模型的方法。 不幸的是,当前的“冻结 RAG”范例(仅训练部分流程,实际模型本身未更新)在演示之外表现不佳。 本博客概述了下一代 RAG,其中所有内容均专门针对任务进行了调整。 在此系统中,像 Mistral 7B 这样的开放模型可以胜过传统的 GPT-4 RAG。

SD3-Turbo

https://arxiv.org/abs/2403.12015
Stable Diffusion 3 是一个强大的图像生成模型。 本文介绍了潜在对抗扩散蒸馏,它将扩散步骤数减少到 4,同时保持图像生成质量。


工程


Code for Quiet-Star (GitHub Repo)

https://github.com/ezelikman/quiet-star
Quiet-Star 是一个推理框架,可以提高语言模型生成正确输出的能力。 其代码已与每个Toke 8 个步骤的模型一起发布。

将训练数据压缩成更小的集合

https://vision.huji.ac.il/podd/
海报数据集蒸馏是一种新方法,可将整个数据集压缩为单个“海报”,使 AI 模型能够从每类不到一张图像中进行学习。

使用 MoE 适配器持续学习 (GitHub Repo)

https://github.com/jiazuoyu/moe-adapters4cl
研究人员开发了一个新的框架,帮助视觉语言模型持续学习,而不会忘记以前的知识,使用一个系统,该系统可以通过针对新任务的特殊适配器来扩展模型。


杂七杂八


一种新的指令跟随代理

https://sites.google.com/view/minedreamer/main
MineDreamer 是一款 AI 代理,凭借其对高级语言和视觉模型的创新使用,擅长遵循 Minecraft 世界中的复杂指令。

“AI,请不要广告”:4 个字就抹掉 1 万亿美元

https://12challenges.substack.com/p/ai-no-ads-please-4-words-to-wipe
人工智能的进步对广告技术行业构成了重大威胁,因为它具有过滤广告的能力,可能会减少谷歌、Meta 和 TikTok 等公司目前享有的 1 万亿美元的年收入。 本系列探讨人工智能如何通过吸引消费者对无广告内容的渴望来扰乱关键的广告库存,并对大型科技公司商业模式的稳定性提出质疑。 该分析深入探讨了人工智能对广告消费的影响,这对 OpenAI、微软、苹果、Meta 和 Alphabet 等主要参与者都有影响。

OpenAI 的“自己的目标”

https://garymarcus.substack.com/p/openais-own-goal
埃隆·马斯克(Elon Musk)的诉讼凸显了 OpenAI 背离了其最初的开源精神,转向了更加封闭、以利润为导向的模式,这与其创立原则相矛盾。 OpenAI 联合创始人 Ilya Sutskever 和马斯克 2015 年之间的一封电子邮件表明,OpenAI 很早就知道它会偏离其既定的使命。 随着 OpenAI 面临着未能纠正公众误解、导致潜在有害的人工智能输出以及偏离其非营利起源的指控,批评不断增加。

Fitbit 使用 Google Gemini 进行人工智能,可以成为你的健身教练

https://www.pcmag.com/news/fitbit-using-google-gemini-for-new-ai-that-could-become-your-fitness-coach
Google 和 Fitbit 正在开发基于 Gemini 的大语言模型,以在 Fitbit 应用程序中提供个性化的健康建议和建议,

LlamaGym (GitHub Repo)

https://github.com/KhoomeiK/LlamaGym
通过在线强化学习微调 LLM 代理。

如果它没有发生,AGI 不会到来怎么办?

https://www.mindprison.cc/p/what-if-agi-is-not-coming
有证据表明,我们可能正在接近硬件扩展极限——尽管资源增加,但像 GPT-4 这样的 LLM 却显示出回报递减。

相关文章

  • Gradle-构建脚本

    Gradle 构建配置脚本常识科普 构建语言 Gradle提供了一种领域特定语言,目前同时支持 Groovy 和 ...

  • 22Mahout 构建社会化推荐引擎

    基于 Apache Mahout 构建社会化推荐引擎http://www.ibm.com/developerwor...

  • mysql复习-理论

    选择归纳 关系模型理论出现:1970年-Codd(IBM) SQL语言最早提出的公司:IBM 关系模型三要素: 1...

  • Coding and Paper Letter(七)

    资源整理 1 Coding: 1.R语言包smapr,用于获取和处理NASA SMAP数据的R包。NSIDC提供多...

  • mod10 算法解析

    概要 模10 算法,也称 "Luhn" 算法(以其创建者 IBM科学家Hans Peter Luhn 命名)。是一...

  • Python设计模式 - 建造者模式

    """ 建造者模式:将一个复杂对象的构建与它的表示分离,使得同样的构建过程可以创建不同的表示。 相关模式:思路和模...

  • 第六讲 SQL语言概述

    SQL语言概述 1974年首次由Boyce和Chamber提出 1975-1979年, 由IBM的San Jose...

  • 模因

    模因 模因论认为任何可以被模仿、复制和传播的观念、语言、文化都是属于模因。弗朗西斯·海拉恩提出,“模因从被新的宿主...

  • SQL语言

    SQL语言的兴起与语法标准 20世纪70年代,IBM开发出SQL,用于DB2 1981年,IBM推出SQL/DS数...

  • PySpark机器学习 Machine Learning wit

    Machine Learning with PySpark - 2019.Pdf 使用PySpark构建机器学习模...

网友评论

      本文标题:2024-03-20 简讯 : IBM 和 NASA 构建语言模

      本文链接:https://www.haomeiwen.com/subject/sozxtjtx.html