头条
Google Workspace 的 Gemini Business 和 Gemini Enterprise 即将推出
https://9to5google.com/2024/02/19/gemini-business-enterprise/
谷歌正在为 Workspace 客户推出“Gemini Business”和“Gemini Enterprise”计划,提供其先进的人工智能模型 Gemini 1.0 Ultra 的访问权限,并提供企业级数据保护。 它不会使用员工对话进行模型培训。
OpenAI 与 Thrive Capital 达成价值 800 亿美元的交易
据报道,在与风险投资公司 Thrive Capital 达成交易后,OpenAI 的估值已超过 800 亿美元。 这一估值在不到 10 个月的时间里增长了近 3 倍,使 OpenAI 成为全球第三高估值的科技初创公司。 该交易涉及“要约收购”下的股票出售,允许员工兑现其在公司的股票。
Magic 融资 1.17 亿美元以继续代码生成模型
https://twitter.com/magicailabs/status/1758140204446323188
Magic 正在建造 AI软件工程师,并筹集了更多资金来帮助完成这一过程。
研究
KV Quant - 扩展到 1000 万个代币
https://arxiv.org/abs/2401.18079
量化 KV 缓存是 Transformer 架构的一个技术细节,可以使其在推理时使用更少的内存。 量化是在质量损失最小的情况下缩小浮点精度。
增强型语音翻译
https://arxiv.org/abs/2402.10422v1
ZeroSwot 是一种新的语音翻译(ST)方法,克服了数据缺乏以及语音和文本之间的差异。 它使用独特的技术仅使用语音识别数据来训练语音编码器,使其能够与多语言翻译模型一起使用。
让 CLIP 直观易懂
https://arxiv.org/abs/2402.10376v1
SpLiCE是一种新方法,可以使CLIP复杂的视觉数据更容易理解。
工程
ControlVectors 库 (GitHub Repo)
https://github.com/vgel/repeng/
ControlVector 是一种廉价地引导语义生成输出的方法。 它们的训练成本比 LoRA 便宜,但仍然非常有效。 这个库让它变得更容易。
OpenRLHF (GitHub Repo)
https://github.com/OpenLLMAI/OpenRLHF
这是 Llama 风格模型的 RLHF 基于 Ray 的实现,其中包括 Mistral。 它包含许多 PPO 稳定技巧来提高性能。
适用于智能机器人的 3D 扩散器 (GitHub Repo)
https://github.com/nickgkan/3d_diffuser_actor
3D Diffuser Actor 结合了扩散策略和 3D 场景表示来改进机器人操作。 这种人工智能驱动的方法使机器人能够更有效地理解环境并与其交互。
杂七杂八
如何在 AdamW 中联合调优 LR 和 WD
AdamW 通常用于解耦学习率和权重衰减。 然而,Pytorch 中的常见实现并没有明确执行此操作。 这篇文章讨论如何调整这些参数。
走进 OpenAI
有没有想过 OpenAI 如何能够以如此快的速度进行创新和构建? 在本播客中,OpenAI 开发者关系主管 Logan Kilpatrick 讨论了 OpenAI 的独特文化、高度代理和紧迫性的重要性,以及公司推出产品的决策框架。
增强密集视频分析变压器
开发了一种新的时间扩张视频变换器(TDViT)来改进密集视频任务的分析,例如逐帧视频对象检测。
OpenLLMetry (GitHub Repo)
OpenLLMetry-JS 是一组基于 OpenTelemetry 构建的扩展,可让您对 LLM 应用程序具有完全的可观察性。
可供出租的 GPU 集群列表
按小时出租的完整集群列表。
Unspam AI (Product)
反垃圾邮件人工智能
网友评论