头条
Google 正在洽谈向 Character.AI , 并投资数亿美元
https://www.calcalistech.com/ctechnews/article/h1vdzfaqt
谷歌正在洽谈投资数亿美元,以加深与 Character.AI 的关系。
Zapier AI Actions
https://actions.zapier.com/
Zapier 推出了 AI Actions,这是一款供开发人员使用的工具,可以让任何 AI 平台运行 Zapier 的 20,000 多个自动化操作。 AI Actions 的工作原理是让用户向 AI 平台发送自然语言命令,然后 AI 平台执行所需的操作。 该服务支持多个人工智能平台,设置简单且具有固有的 API 集成。
FigJam 引入 AI
https://www.figma.com/blog/introducing-ai-to-figjam/
Figma 已将人工智能辅助纳入其数字白板工具 FigJam 中,以简化和增强设计协作。 面向实用程序的增强功能(例如源自人工智能驱动的项目 Jambot 的增强功能)可帮助用户在虚拟画布上更有效地协作。 Figma 的目标是通过利用机器学习功能进行视觉设计,从而扩大各种用户需求的适用性。
研究
深入探讨:对语言模型的对抗性攻击
https://lilianweng.github.io/posts/2023-10-25-adv-attack-llm/
这篇博文介绍了针对语言模型系统出现的不同攻击。 它包含有关不同类型攻击的精彩信息以及团队发现的一些有效缓解措施。
使用 2D 扩散模型对 3D 网格进行风格化
https://arxiv.org/abs/2311.05464v1
这项研究提出了 3DStyle-Diffusion 模型,这是一种用于 3D 网格详细风格化的新颖方法,集成了 2D Diffusion 模型以增加对外观和几何形状的控制。 它的工作原理是首先使用隐式 MLP 网络将 3D 网格的纹理参数化为反射率和光照,然后使用预先训练的 2D 扩散模型将渲染图像与文本提示对齐并确保几何一致性。
以新的注意力增强视听模型(GitHub Repo)
https://github.com/haoyi-duan/dg-sct
该项目引入了双引导时空(DG-SCT)注意力机制,该机制增强了多模态任务的预训练视听模型。
工程
HuggingFace 对齐手册
https://github.com/huggingface/alignment-handbook
随着最近发布的出色的 Zephyr 语言模型,HuggingFace 团队展示了如何训练基于少数强大的预训练开源模型构建的个性化模型。
音频超分辨率(GitHub Repo)
https://github.com/haoheliu/versatile_audio_super_resolution
音频超分辨率是提高任何音频(真实或合成)的质量和保真度的过程。 大多数超分辨率系统都是针对特定任务的,具有针对单一音频数据类型(例如语音与音乐)进行训练的单一模型。 这项新工作向前迈出了惊人的一步,单一模型可以提高跨任务的音频质量。
Web 代理工具包 (GitHub Repo)
https://github.com/reworkd/tarsier
随着强大的新视觉模型的出现,许多团队正在尝试构建使用视觉与网络元素交互的代理。 Tarsier 工具包引入了一组标准工具(例如元素标记)。 人们可以使用任何视觉系统来理解网页并采取行动。 它还包括用于非视觉语言模型浏览的实用程序。
杂七杂八
超快速文本转语音生成(Jupyter Notebook)
https://colab.research.google.com/github/ylacombe/explanatory_notebooks/blob/main/extra_fast_bark_for_long_Generation.ipynb
使用 Bark 文本转语音系统生成连贯、快速且超长的音频输出的示例。
用于语言视觉技能习得的LLaVa Plus模型
https://llava-vl.github.io/llava-plus/
LLaVa 模型是一个结合了语言和视觉的开源模型。 这个新版本允许指令调整的模型使用工具进行图像编辑、生成等。
使用 RWKV 运行本地 AI 小镇(GitHub 存储库)
https://github.com/recursal/ai-town-rwkv-proxy
人工智能小镇是一项令人惊叹的实验,数百名智能体在语言模型中以提示状态过着日常生活。 RWKV 模型是一种线性语言模型,比标准 Transformer 需要更少的资源。 该存储库使用这种更便宜的模型在本地计算机上运行 AI 城镇。
OHMYSYNT(产品)
https://ohmysynt.io/
为品牌提供个性化人工智能内容。
Poe 创作者货币化简介
https://quorablog.quora.com/Introducing-creator-monetization-for-Poe
Poe 更新了其人工智能平台,通过订阅收入分成和每条消息的费用来支持创作者创收,旨在为机器人开发人员和小型人工智能公司提供支持。 AI创收已在美国展开,全球扩张即将到来。
网友评论