头条
苹果正在投入资金通过生成式人工智能改进 Siri
https://appleinsider.com/articles/23/09/06/apple-is-pouring-money-into-siri-improvements-with-generative-ai
苹果增加了开发人工智能的预算,强调为 Siri 创建对话式聊天机器人功能——据称每天在研发上花费数百万美元。
Falcon 180B模型发布
https://falconllm.tii.ae/falcon-models.html
来自阿联酋的 Falcon 长期以来一直是最好的开放式模型。最新的 180B 参数模型略优于 Llama 270B,并具有 2k 上下文窗口。从历史上看,这些模型的可调性非常好。然而,考虑到资源需求,尚不清楚社区是否会采用这个最新模型。
OpenAI首届开发者大会
https://openai.com/blog/announcing-openai-devday
OpenAI 将于 2023 年 11 月 6 日在旧金山举行首届 DevDay 会议。该活动将预览新工具并促进思想交流,吸引了全球数百人。目前,超过200万开发者通过OpenAI不断更新的API使用GPT-4和DALL·E等工具。
研究
减少 RLHF 中的 PPO 内存使用
https://arxiv.org/abs/2309.00754
PPO 在 RLHF 中是一种痛苦,因为你需要有 3 个模型在周围浮动。然而,它们都保持密切的关系,只需要彼此进行小的更新。输入洛拉。如果您使用适配器,则可以显着降低内存成本,而不会损失性能。美丽的想法在于它的简单。
在 Jax 中模拟订单簿
https://arxiv.org/abs/2308.13289
金融机构使用一种称为限价订单簿的东西来维护其平台上交易的所有交易信息。这很有用,但它通常在 CPU 上运行,这使得在 CPU 上运行 RL 变得很困难。本文讨论了创建一个在用 JAX 编写的 GPU 上运行的订单簿。
增强语音驱动的 3D 人脸动画
https://arxiv.org/abs/2308.05428v1
这项研究深入研究了由语音驱动的 3D 面部动画的复杂性,强调了两个重要方面:随着时间的推移改变面部移动方式的全局因素(复合性质)以及面部不同部分如何根据局部肌肉独立移动(区域性质) 。
工程
TokenFlow (GitHub Repo)
https://github.com/omerbt/TokenFlow
使用预先训练的文本到图像模型来编辑视频会产生梦幻般的奇怪结果。 TokenFlow 更加流畅,并且保留了原始视频的许多语义和结构特征。它的性能似乎几乎超过了 Runway Gen-2。
Comgra (GitHub Repo)
https://github.com/FlorianDietz/comgra
与 PyTorch 一起使用的库,可以更轻松地检查神经网络的内部结构。
使视频头像适应不同的灯光和背景
http://haonanqiu.com/projects/ReliTalk.html
ReliTalk 是一项很酷的技术突破,即使您改变灯光或背景,我们也能让视频头像看起来很自然。它使用单个视频和您的声音来创建 3D 面部模型。
杂七杂八
LLM可以从单一例子中学习吗?
https://www.fast.ai/posts/2023-09-04-learning-jumps/
人工智能模型似乎能够在只看到一次数据集中的示例后快速记住它们。这一惊人的壮举与大多数先前关于神经网络样本效率的看法相矛盾。
判断两张相似图片是否真的相同的 3D 新方法
https://doppelgangers-3d.github.io/
Doppelgangers 是一种新技术工具,可帮助确定两张看起来几乎相同的图片实际上是否显示相同的 3D 对象。它足够聪明,可以避免人类可能犯的错误。
人工智能革命将如何重塑世界
https://time.com/6310115/ai-revolution-reshape-the-world/
有人认为,即将到来的技术浪潮(主要由人工智能驱动)将预示着历史性的权力重新分配。
OpenAI将于11月6日举办首届开发者大会
https://techcrunch.com/2023/09/06/openai-will-host-its-first-developer-conference-on-november-6/
OpenAI 今天宣布,将于 11 月 6 日举办开发者大会 OpenAI DevDay。
Seona (新产品)
https://seona.usestyle.ai/
Seona 是一款人工智能助手,用户SEO的优化。
网友评论