美文网首页
2024-10-16 简讯 : Adobe 发布新的视频模型

2024-10-16 简讯 : Adobe 发布新的视频模型

作者: 数科每日 | 来源:发表于2024-10-14 22:13 被阅读0次

头条


Adobe 发布新的视频模型

https://blog.adobe.com/en/publish/2024/10/14/generate-video-beta-on-firefly-web-app

Adobe 在 Adobe MAX 大会期间宣布将其 Firefly 系列创意生成 AI 模型扩展到视频领域。

OpenAI 任命国际扩张主管

https://www.theregister.com/2024/10/09/openai_appoints_international_expansion_boss/

OpenAI 已任命 Oliver Jay 领导国际扩张,专注于 AI 战略和运营。该公司宣布在新加坡设立新的 APAC 办事处,并正在开发本地语言数据集。o1 模型利用“思维链”技术,旨在提高 AI 准确性。

微软可能正在开发音频转图像生成器

https://www.zdnet.com/article/microsoft-may-have-an-audio-to-image-generator-in-the-works-new-patent-shows/

微软已为一种使用 LLM 将实时音频转换为图像的 AI 系统申请了专利。该系统旨在通过从音频流生成实时图像来增强通信。如果开发成功,它可以通过 Copilot 集成到 Microsoft Teams 中。


研究


10B 分布式训练运行

https://www.primeintellect.ai/blog/intellect-1

语言模型的分散训练是使用异构和非共置硬件来训练单个模型的过程。由于内存传输成本高昂,这在传统上具有挑战性。这项工作改进了最先进的高度分布式训练算法。

视觉-语言分割

https://arxiv.org/abs/2410.08021v1

OneRef 通过将视觉和语言特征空间统一到单个转换器中,引入了一个用于引用分割的简化框架。

使用 SmartPretrain 进行运动预测

https://arxiv.org/abs/2410.08669v1

SmartPretrain 引入了一种灵活、与模型无关、与数据集无关的自监督学习框架,用于改进自动驾驶汽车的运动预测。


工程


UvA - 组等变深度学习简介

https://uvagedl.github.io/

学习资源,用于在面临架构约束的情况下,进一步了解针对某些类型的几何数据的深度学习技术。

模拟 CS:GO 的扩散模型

https://github.com/eloialonso/diamond/tree/csgo

扩散模型的开放复制,该模型模拟视频游戏的视觉效果,同时将键盘和鼠标控制作为输入。

通过奖励感知学习改进 LLM 偏好对齐

https://github.com/shenao-zhang/reward-augmented-preference

这项研究解决了 LLM 中当前对齐算法的局限性,这些算法通常会过度拟合相对偏好并忽略响应质量。通过引入奖励条件 LLM 策略,作者提出了一种新颖的数据重新标记技术,该技术将响应质量考虑在内,帮助模型推广到最佳响应。


杂七杂八


Anthropic 以经济实惠的批处理挑战 OpenAI

https://venturebeat.com/ai/anthropic-challenges-openai-with-affordable-batch-processing/

Anthropic 推出了消息批处理 API,允许企业以标准 API 调用成本的一半处理大量数据。该 API 在 24 小时内支持多达 10,000 个异步查询,提供了一种经济高效的选项,将 AI 处理从实时转移到“适时”。此举促进了中型企业对 AI 的采用,尽管它可能会分散人们对推进实时 AI 能力的关注。

人工智能将从内部接管人类系统

https://www.noemamag.com/al-will-take-over-human-systems-from-within/

在这篇文章中,以色列历史学家、《人类简史》、《未来简史》和《Nexus》的作者尤瓦尔·诺亚·哈拉里讨论了信息网络和人工智能在塑造可以统一或分裂社会的叙事方面的作用。他警告说,人工智能作为一种“外星智能”,可能会集中权力,而且它缺乏自我纠正机制,对民主结构构成风险。哈拉里强调,在由强大的人工智能系统主导的环境中,需要强大的机构来管理真相,这些系统会影响各个领域的决策。

后 AGI 时代的粘性人类

https://www.theintrinsicperspective.com/p/sticky-humans-in-a-post-agi-world

人工智能导师在复制人类教师提供的社交和智力参与方面面临重大挑战。尽管取得了进步,但人工智能在细致入微的教育任务方面仍举步维艰,缺乏提供人类提供的社会智力体验的能力。由于学习固有的社会和文化成分,人工智能增强而不是取代人类教育者的混合方法可能更有效。

Entropix 可视化

https://github.com/samefarrar/entropix_mlx/tree/metrics_viz

Entropix 是一种改变语言模型采样行为的工具。

OpenAI 预测 2026 年亏损将增加三倍至 140 亿美元

https://www.xm.com/research/markets/allNews/reuters/openai-projections-imply-losses-tripling-to-14-billion-in-2026-the-information-53942296

OpenAI 预测 2026 年损失将增至 140 亿美元,到 2028 年总损失将达到 440 亿美元。

AMD 推出 AI 芯片与 Nvidia 竞争Blackwell

https://www.cnbc.com/2024/10/10/amd-launches-mi325x-ai-chip-to-rival-nvidias-blackwell-.html

AMD 推出了 Instinct MI325X AI 芯片,旨在与 Nvidia 占主导地位的数据中心 GPU 竞争。

相关文章

网友评论

      本文标题:2024-10-16 简讯 : Adobe 发布新的视频模型

      本文链接:https://www.haomeiwen.com/subject/kpmzrjtx.html