头条
亚马逊加强人工智能研发
亚马逊正在通过从人工智能初创公司 Adept 聘请顶尖人才来增强AI能力。
YouTube 允许AIGC内容删除申请
YouTube 已更新其政策,允许个人请求删除模仿其声音或肖像的AIGC内容。
Google AI 概览:SE Ranking 的新研究
https://seranking.com/blog/google-ai-overviews-research/
Google 的 AI 概览 (AIO) 功能现在仅出现在 10 万个关键词的 SERP 中的 8.71%,与推出前的 64% 相比有显著下降,大多数 AIO 都链接到前 10 个自然结果。推出后,AIO 内容的长度和链接数量都有所增加,这表明 Google 重视详细的答案和权威来源。SEO 策略必须适应这种不断变化的搜索环境,才能保持相关性,其中用户查询的字数更多、搜索量更低、每次点击费用更低,更有可能触发 AI 生成的响应。
研究
Meta 3D Gen
https://ai.meta.com/research/publications/meta-3d-gen/
Meta 已经训练了一个最先进的 3D 对象生成模型以及一个 PBR 纹理生成系统。它使用公司内部的 2D 图像生成模型作为合成数据生成的工具。
LLM 的适应性逻辑控制
https://arxiv.org/abs/2406.13892
这项工作允许在推理时进行交互式文本编辑和控制模型生成。它允许在生成过程中进行逻辑约束,并在小模型中实现强大的性能。
使用成对差异学习进行分类
https://arxiv.org/abs/2406.20031v1
研究人员将成对差异学习 (PDL)(最初是一种回归技术)扩展到分类任务。PDL 不是直接预测结果,而是预测实例对之间的差异。
工程
Mutahunter
https://github.com/codeintegrity-ai/mutahunter
一种开源语言无关的基于 LLM 的突变测试,用于自动化软件测试。
使用 LLM 的机器人技术
https://github.com/lostxine/llara
LLaRA 是一个框架,它使用大型语言模型 (LLM) 通过对话式指令响应对来改进机器人动作策略。通过集成视觉输入,这些视觉语言模型 (VLM) 处理状态信息并生成最佳策略决策。
使用多样化的视觉指令数据增强多模态模型
https://github.com/jihaonew/mm-instruct
MM-Instruct 是一个大型数据集,旨在增强大型多模态模型 (LMM) 的指令遵循能力。
杂七杂八
Parser 的寓言
https://drive.google.com/file/d/1VodGljuEhBKwZIXQwN-ApH6g2wBAVAdK/view
CVPR 的精彩主题演讲。
为什么我们不再使用 LangChain 来构建我们的 AI 代理
https://www.octomind.dev/blog/why-we-no-longer-use-langchain-for-building-our-ai-agents
Octomind 放弃了用于 AI 测试自动化的 LangChain 框架,转而采用更简单、模块化的构建块,从而提高了其代码库和团队生产力。它在 LangChain 的高级抽象方面遇到了不灵活性,使开发和维护变得复杂。通过切换策略,Octomind 现在拥有更精简的架构和更快的 AI 代理任务迭代速度。
人工智能悲伤的五个阶段
https://www.noemamag.com/the-five-stages-of-ai-grief/
Benjamin Bratton 是 Berggruen 研究所 Antikythera 项目主任,也是加州大学圣地亚哥分校的教授,他将全球对人工智能的反应称为“哥白尼创伤”,将其等同于过去重新定义人类自我认知的转变。Bratton 提出了“人工智能悲伤”的五个阶段——否认、愤怒、讨价还价、沮丧、接受——以构建社会对人工智能进化的反应,从怀疑到融入我们对智能的理解。他认为,人工智能的整合反映了更广泛的生物和技术进化过程,而不是独特的人类叙事。
InstantStyle+
https://instantstyle-plus.github.io/
使用现代传播模型和内容嵌入器进行风格转换。
Apple 将获得 OpenAI Observer Board席位
https://9to5mac.com/2024/07/02/apple-phil-schiller-openai-board-observer/
Apple 研究员 Phil Schiller 将出席 OpenAI 董事会会议,但没有投票权,这与微软的角色相似。
使用 Mamba 进行遥感
https://arxiv.org/abs/2404.18895v1
研究人员引入了一种新方法 RSCaMa,用于使用自然语言描述遥感图像的变化。
网友评论