头条
谷歌与 AI 初创公司 Replit 合作,挑战微软的 GitHub
谷歌正在与 Replit 合作,将其 AI 语言模型与 Replit 的 Ghostwriter 软件相结合,后者可帮助程序员编写代码。此次合作旨在与微软的 GitHub Copilot 竞争,后者使用 OpenAI 的语言生成 AI。 Ghostwriter 将使用谷歌的 AI 来改进代码建议、程序完成和回答开发人员的问题。 Replit 计划通过为代码编写、测试、部署、应用审查和协作提供端到端支持来增强其软件。通过此次合作,Replit 还将扩大其对谷歌云服务的使用及其软件的分发。
OpenFlamingo
去年 Deepmind 发表了关于他们的 Flamingo 模型的研究,这是一个强大的多模态文本和视觉模型。该模型可以回答有关图像的问题,同时仍然是一个强大的文本模型。 Laion 现在发布了一个用于训练 Flamingo 模型的框架和一个 9B 参数检查点,该检查点在 Multimodal C4 数据集的 5M 样本和来自 LAION-2B 图像数据集的 10M 样本上训练。该模型不可用于商业应用,因为它使用 Meta 的 7B Llama 检查点。它在基准性能方面也无法与 Deepmind 的 Flamingo 相提并论。
Perplexity AI series A
人工智能搜索领域的初创领导者之一推出了 iPhone 应用程序并筹集了额外资金。他们的目标是成为知识发现的领导者。我们将看看这些服务中有哪些会有所不同,但短短几个月内 200 万用户的增长令人印象深刻。
研究
ChatGPT 是新的 MTurk
NLP 需要数据,这些数据通常由各种平台上的众包工作者标记。事实证明,gpt-3.5-turbo 非常擅长遵循标签说明,并且在相关性、立场、主题和其他重要指标方面往往优于人类注释者,这也许并不令人意外。更重要的是,它的成本也比雇用人工注释者低得多(大约 20 倍)。
EVA-CLIP:大规模改进 CLIP 训练技术
该论文介绍了 EVA-CLIP,这是一组显着提高 CLIP 训练效率和有效性的模型。 EVA-CLIP 与之前的模型相比,在参数数量相同但训练成本更低的情况下实现了更优的性能,并发布了完整的套件用于开放研究。
揭开 Imagen 的面纱:Classification Showdown
Imagen 是一种文本到图像扩散模型,在零样本分类方面与 CLIP 相媲美,在形状/纹理偏差测试中表现出色,并建议生成预训练作为视觉语言任务中的一种有价值的方法。
工程
Anti-DreamBooth:保护用户免受个性化文本到图像合成的影响 (GitHub Repo)
本文讨论了文本到图像扩散模型(如 DreamBooth)如何从简单的文本输入生成逼真的图像,但也可能被滥用来产生针对个人的虚假新闻或令人不安的内容。该论文提出了一种称为 Anti-DreamBooth 的防御系统,该系统会向用户图像添加细微的噪声扰动,以破坏在其上训练的任何 DreamBooth 模型的生成质量,并评估其针对各种文本到图像模型版本的各种算法的有效性.
Text2Video-Zero,文本到视频的生成
本文通过修改现有的文本到图像合成方法,介绍了一种低成本的零镜头文本到视频生成方法。该方法通过运动动力学丰富了潜在代码,并对帧级自注意力进行了重新编程,以保留前景对象的上下文、外观和身份,从而无需额外的视频数据即可生成高质量且一致的视频。该方法还适用于其他任务,例如条件和内容专用视频生成以及指令引导视频编辑。
AIx (GitHub Repo)
AIx 是一个与 LLM API 交互的 CLI 工具。
杂七杂八
另一个LLM微调框架
在你自己的数据上微调大型语言模型变得越来越容易,但这仍然是一个有点挑战性的系统问题。 xTuring 是另一种为有兴趣在自定义数据上使用某些“开放”模型的人简化流程的方法。
ChatGPT 获得了一台电脑
在文章中,作者讨论了 ChatGPT 和 Anthropic 的 Claude 等人工智能助手的发展和能力,以及它们与传统确定性计算机的区别。 AI 助手在思考和交流方面更像人类,随着 Wolfram|Alpha 等插件的加入而不断发展,以提供更准确和实时的信息。作者承认人工智能的潜在好处和风险,强调使用人工智能的人的意图将最终决定结果,并认为我们应该推动人工智能显着改善生活的积极成果。
Roblox 正在整合生成式人工智能
本文探讨了生成式 AI 在游戏创作平台 Roblox 中的使用,并讨论了它如何塑造游戏开发和元宇宙的未来。
员工向 ChatGPT 提供敏感数据
员工现在不小心将敏感的公司数据放入 ChatGPT,引发了对专有信息安全性的担忧。
生成式人工智能可能影响 3 亿个工作岗位
高盛报告称,生成式人工智能可能影响多达 3 亿个工作岗位。
Taxy AI (GitHub Repo)
Taxy 使用 GPT-4 来控制浏览器并执行重复操作。
网友评论