头条
在世界各地销售AI产品仍然太难
https://a16z.com/2023/07/28/merchant-of-record-generative-ai-digital-first-global/
尽管创建一家公司从未如此简单,但在全球范围内销售产品仍然非常困难。 a16z 解释了为什么Merchant of Record计划可能是解决方案。
Stack Overflow 通过 OverflowAI 进入生成式 AI 世界
https://venturebeat.com/ai/stack-overflow-jumps-into-the-generative-ai-world-with-overflow-ai/
Stack Overflow 正在将生成式人工智能功能集成到其平台中,以增强搜索功能并为开发人员提供帮助。 OverflowAI 将于 8 月推出 alpha 版本。 这些工具包括 Visual Studio Code 扩展和 Slack 集成。
研究
谷歌在机器人领域取得新突破
https://robotics-transformer2.github.io/
Transformers 被用到了计算机视觉,Transformers 也被用来做计划,Transformers 也可以用来做控制么? 看起来Transformers 正在继续通过谷歌的下一代机器人技术迭代来统治世界,这些技术使用强大的预训练模型来提高机器人性能的各个方面。
语言模型学习技能来学习语言
https://arxiv.org/abs/2307.14430
作为弄清楚语言模型在预训练时的作用的一部分,您可以设置合成数据任务来测试各种技能,然后整理包含有助于告知这些技能的数据的数据集。 如果您对 10 亿个Token进行训练,则可以获得与使用适当管理的数据集对 30 亿个Token进行训练相同的性能。
人工智能现在可以从模拟环境中学习
https://arxiv.org/abs/2307.14993v1
Thinker算法引入了一种独特的方法,允许人工智能独立地与模拟环境交互并从中学习,从而提高其制定战略计划的能力。 该算法在 Sokoban 和 Atari 2600 基准游戏中进行了测试,显示出顶级性能,为人工智能强化学习提供了一种新方法,并彻底改变了规划与决策过程的整合方式。
工程
文本生成接口 (GitHub Repo)
https://github.com/huggingface/text-generation-inference
用于文本生成推理的 Rust、Python 和 gRPC 服务器。 在 HuggingFace 的生产中用于为 Hugging Chat、推理 API 和推理端点提供支持。 最近更改了许可证,不可用于商业用途。
谷歌的Bard和视觉理解的挑战 (GitHub Repo)
https://github.com/htqin/googlebard-visunderstand
谷歌的对话式人工智能 Bard 现在能够处理除文本之外的视觉输入,为多模式生成模型创造了新的可能性。 然而,这项针对 13 个不同视觉场景的研究表明,巴德在视觉理解方面存在困难,这表明人工智能模型的未来发展还有很大的改进空间。
通过自我监督学习获得更好的医学成像
https://arxiv.org/abs/2307.14725v1
该研究引入了 vox2vec,这是一种创新方法,它使用自我监督学习来更好地理解体素(3D 像素)级别的 CT 扫描等医学图像。 结果表明,与该领域的其他技术相比,vox2vec 表现出色,提供了一种更高效的解决方案,需要更少的可训练参数。
杂七杂八
生成式人工智能和工作的未来
https://www.mckinsey.com/mgi/our-research/generative-ai-and-the-future-of-work-in-america
麦肯锡关于人工智能将如何促进某些职业的工作并削弱其他职业的增长的报告。
无人发现的人工智能教育问题
https://thealgorithmicbridge.substack.com/p/the-ai-generated-education-issue
想要遏制人工智能作弊浪潮的教师必须寻找人工智能编写检测器之外的其他地方,因为目前很明显检测器并不有效。
人工智能和数据角色的悖论
https://tomtunguz.com/why-data-teams-will-grow-ai/
Tomasz Tunguz 解释了为什么尽管人工智能将使一些数据工作自动化,但它也对数据团队提出了更多要求。
Llama 2 7B 32k 上下文长度
https://together.ai/blog/llama-2-7b-32k
Togethercompute 最近筹集了 2000 万美元,对 Llama 2 进行了微调,对位置嵌入进行了线性扩展,以在上下文中处理多达 32k 个令牌。 他们测试了许多有趣的基准,但警告说“忘记中间”在现代语言模型中仍然是一个很大的问题。
Khoj (GitHub Repo)
https://github.com/khoj-ai/khoj
数字大脑:AI 个人助理。
AI Logo Art (Product)
https://ailogoart.com/
人工智能标志艺术通过人工智能将Logo转变为令人惊叹的艺术。
网友评论