头条
谷歌 CEO 桑达尔皮查伊表示搜索将包括聊天 AI
谷歌首席执行官 Sundar Pichai 表示,谷歌计划在其旗舰搜索引擎中添加对话式人工智能功能,以应对来自 ChatGPT 等聊天机器人的压力以及更广泛的业务问题。皮查伊在接受《华尔街日报》采访时表示,人工智能的进步将增强谷歌回答一系列搜索查询的能力。他驳斥了聊天机器人对谷歌搜索业务构成威胁的观点,搜索业务占母公司 Alphabet Inc. 收入的一半以上。
GPT-4 是一个推理引擎
作者讨论了知识数据库在 AI 进步中的重要性以及个人知识库的价值。他们强调,人工智能实用性的进步将来自于其在正确时间获取正确知识的能力的提高,而不仅仅是来自其推理能力。作者还强调了矢量数据库在存储信息和向 AI 应用程序提供信息方面的作用,以及个人知识库在定制 AI 体验方面的潜在价值。
分割 - 检测 - 绘画 (GitHub Repo)
新的 segment anything 模型非常擅长分割图像中的对象。 Dino 是通用检测模型,stable diffusion 是图像生成模型。如果将这三者结合起来,将获得极其强大的分割、检测和生成管道。在混合中添加最后一块 Blip 后,可以为图像的任何部分生成标题。
研究
训练大型语言模型的秘诀
大多数使用 AI 工具的人并不经常训练大型(>1B 参数)模型。当放大模型时,有很多事情会发生变化。如果你想训练更大的模型时,这份报告收集了很多有用的提示。它涵盖了初始化、实验策略等内容,并提供了一些你可能想要使用的示例工具。
本周 ML 论文 (GitHub Repo)
一个需要定期参考的重要论文列表。该列表看起来质量很高并且经过精心整理。
Full proof generation with proof repair
生成语言模型的一个常见问题是它们容易产生幻觉。人们指出,有时这些模型生成的代码有细微的错误,但看起来似乎有道理。在这种情况下,验证行为有时比生成更重要。验证很难,尤其是对于代码生成。本文研究了可以被正式系统检查的证明生成。
工程
自动生成langchain工具或chatGPT插件 (GitHub Repo)
这是对人工智能为自己构建工具的未来的有趣一瞥。在这种情况下,您可以指定一个高级描述来说明希望插件执行的操作——此工具将生成必要的代码来构建一个插件来尝试执行指定的任务。
llama.cpp 项目升级了 Meta 的语言模型
Georgi Gerganov 的 llama.cpp 项目优化了 LLaMA 性能,加载时间加快了 100 倍,内存使用量减半,从而增强了在边缘和个人计算机设备上的用户体验。
Inst-Inpaint:使用扩散模型移除指定对象 (GitHub Repo)
引入 Inst-Inpaint,这是一种新颖的修复框架,可根据自然语言输入从图像中无缝删除对象,无需耗时的二进制掩码。使用 GQA-Inpaint 数据集,该框架优于 GAN 和基于diffusion 的基线,展示了定量和定性的改进。
杂七杂八
预训练高斯过程
机器学习的一个主要研究领域是优化。优化方法可以用于各种有趣的问题,贝叶斯优化甚至允许它在不确定的情况下工作。不过贝叶斯优化有一些缺点,它需要专家来调整模型。这项新工作预训练了高斯过程模型,这些模型用于更快地对新问题进行贝叶斯优化。
在人工智能竞赛中,微软和谷歌选择速度而不是谨慎
本文讨论了谷歌和微软在 AI 聊天机器人市场上的日益普及和竞争,强调了自然语言处理的进步以及围绕它们在各种应用程序中使用的潜在好处和担忧。
Stability AI 公司摇摇欲坠
本文讨论了 Stability AI 这家曾经前途无量的 AI 初创公司在耗尽现金储备时所面临的财务困境,强调了许多 AI 公司在快速发展的技术环境中遇到的挑战和不确定性。
Python 最优运输问题包获得更新
最优传输理论是一个具有丰富历史的领域,它对计算的要求很高。其中一个标准框架已获得升级,提高了速度、添加示例,并提高总体可靠性。
压缩 GPT-4 提示来省钱
一个非常有趣的工具,它可以让你减少发送给 OpenAI 的Token 数量,方法是将它们伪压缩成一堆表情符号。它使用prompt 并要求 GPT-4 可逆地压缩字符串以“适合一篇推特的长度”,不过输出并不总是准确的,而且并不总是有效。
AI Shell (GitHub Repo)
AI Shell 是一个 CLI 工具,可以将自然语言转换为 shell 命令。
Tabby (GitHub Repo)
Tabby 是 GitHub Copilot 的开源替代品。
网友评论