2023-11-15 简讯 : Google 正在洽谈 Ch

作者: 数科每日 | 来源:发表于2023-11-13 22:05 被阅读0次

测试人员的内存救星
常用软件
Chrome浏览器创建多个独立实例
2023-11-15
ubuntu 安装chrome
Zookeeper源码分析2-Leader选举
[书本] 如何通过Google来hacking
一分钟帮你不fanqiang实现在国内访问谷歌
我的Mac工具安装
Ubuntu 安装 selenium

头条

Google 正在洽谈向 Character.AI , 并投资数亿美元

https://www.calcalistech.com/ctechnews/article/h1vdzfaqt
谷歌正在洽谈投资数亿美元，以加深与 Character.AI 的关系。

Zapier AI Actions

https://actions.zapier.com/
Zapier 推出了 AI Actions，这是一款供开发人员使用的工具，可以让任何 AI 平台运行 Zapier 的 20,000 多个自动化操作。 AI Actions 的工作原理是让用户向 AI 平台发送自然语言命令，然后 AI 平台执行所需的操作。该服务支持多个人工智能平台，设置简单且具有固有的 API 集成。

FigJam 引入 AI

https://www.figma.com/blog/introducing-ai-to-figjam/
Figma 已将人工智能辅助纳入其数字白板工具 FigJam 中，以简化和增强设计协作。面向实用程序的增强功能（例如源自人工智能驱动的项目 Jambot 的增强功能）可帮助用户在虚拟画布上更有效地协作。 Figma 的目标是通过利用机器学习功能进行视觉设计，从而扩大各种用户需求的适用性。

研究

深入探讨：对语言模型的对抗性攻击

https://lilianweng.github.io/posts/2023-10-25-adv-attack-llm/
这篇博文介绍了针对语言模型系统出现的不同攻击。它包含有关不同类型攻击的精彩信息以及团队发现的一些有效缓解措施。

https://arxiv.org/abs/2311.05464v1
这项研究提出了 3DStyle-Diffusion 模型，这是一种用于 3D 网格详细风格化的新颖方法，集成了 2D Diffusion 模型以增加对外观和几何形状的控制。它的工作原理是首先使用隐式 MLP 网络将 3D 网格的纹理参数化为反射率和光照，然后使用预先训练的 2D 扩散模型将渲染图像与文本提示对齐并确保几何一致性。

以新的注意力增强视听模型（GitHub Repo）

https://github.com/haoyi-duan/dg-sct
该项目引入了双引导时空（DG-SCT）注意力机制，该机制增强了多模态任务的预训练视听模型。

工程

HuggingFace 对齐手册

https://github.com/huggingface/alignment-handbook
随着最近发布的出色的 Zephyr 语言模型，HuggingFace 团队展示了如何训练基于少数强大的预训练开源模型构建的个性化模型。

音频超分辨率（GitHub Repo）

https://github.com/haoheliu/versatile_audio_super_resolution
音频超分辨率是提高任何音频（真实或合成）的质量和保真度的过程。大多数超分辨率系统都是针对特定任务的，具有针对单一音频数据类型（例如语音与音乐）进行训练的单一模型。这项新工作向前迈出了惊人的一步，单一模型可以提高跨任务的音频质量。

Web 代理工具包 (GitHub Repo)

https://github.com/reworkd/tarsier
随着强大的新视觉模型的出现，许多团队正在尝试构建使用视觉与网络元素交互的代理。 Tarsier 工具包引入了一组标准工具（例如元素标记）。人们可以使用任何视觉系统来理解网页并采取行动。它还包括用于非视觉语言模型浏览的实用程序。

网友评论

本文标题：2023-11-15 简讯 : Google 正在洽谈 Ch

本文链接：https://www.haomeiwen.com/subject/jpidwdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2023-11-15 简讯 : Google 正在洽谈 Ch

头条

Google 正在洽谈向 Character.AI , 并投资数亿美元

Zapier AI Actions

FigJam 引入 AI

研究

深入探讨：对语言模型的对抗性攻击

使用 2D 扩散模型对 3D 网格进行风格化

以新的注意力增强视听模型（GitHub Repo）

工程

HuggingFace 对齐手册

音频超分辨率（GitHub Repo）

Web 代理工具包 (GitHub Repo)

杂七杂八

超快速文本转语音生成(Jupyter Notebook)

用于语言视觉技能习得的LLaVa Plus模型

使用 RWKV 运行本地 AI 小镇（GitHub 存储库）

OHMYSYNT（产品）

Poe 创作者货币化简介

相关文章

测试人员的内存救星

常用软件

Chrome浏览器创建多个独立实例

2023-11-15

ubuntu 安装chrome

Zookeeper源码分析2-Leader选举

[书本] 如何通过Google来hacking

一分钟帮你不fanqiang实现在国内访问谷歌

我的Mac工具安装

Ubuntu 安装 selenium

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读