美文网首页
2024-02-24 简讯 : 谷歌Deepmind开源基于Ge

2024-02-24 简讯 : 谷歌Deepmind开源基于Ge

作者: 数科每日 | 来源:发表于2024-02-22 23:03 被阅读0次

头条


谷歌Deepmind开源基于Gemini的Gemma

https://blog.google/technology/developers/gemma-open-models/
Google 发布了 Gemma 2B 和 7B 参数模型的权重,可通过 HuggingFace 获取。 这些模型是仅解码器的 Transformer,在 2T 和 6T Token 上进行训练。 它们在各种基准测试中都远远优于 Llama 2,并且有基础版本和指令调整版本。

斯坦福 发布 HELM 基准

https://crfm.stanford.edu/2024/02/18/helm-instruct.html
斯坦福大学的语言建模小组发布了一个广泛使用的基准,称为语言模型的整体评估(HELM)。 他们还发布了一个名为 HELM-Instruct 的指令版本。

Reddit 达成一项新的人工智能培训协议来销售用户内容

https://www.theverge.com/2024/2/17/24075670/reddit-ai-training-license-deal-user-content
Reddit 已与一家未具名的大型人工智能公司签订了每年价值约 6000 万美元的许可协议,允许该公司访问其大量用户生成的内容。


研究


Mistral 的 25 多个 LoRA 性能优于 GPT-4

https://predibase.com/blog/lora-land-fine-tuned-open-source-llms-that-outperform-gpt-4
Predibase 发布了 25 个狭窄的特定任务 LoRA,每个 LoRA 在特定任务上的性能均优于 GPT-4。 这些特定于任务的 LoRA 构建在 Mistral 7B 模型上。 这是支持本地模型在精确任务上表现出色的能力的另一个证据。

多模式LLM理解视觉数据的能力 (GitHub Repo)

https://github.com/unimodal4reasoning/chartvlm
ChartX 是一种新工具,用于测试多模态大语言模型 (MLLM) 使用可视化图表进行解释和推理的能力

结合无监督训练和监督微调 (GitHub Repo)

https://github.com/architsharma97/dpo-rlaif
该存储库挑战了训练中监督微调和强化学习相结合的有效性。 使用 GPT-4 等更高级的模型进行初始训练可以优于更复杂的两步方法。


工程


多模态对话数据集

https://ai.meta.com/datasets/mmcsg-dataset/
Meta 发布了 MMCSG 数据集,其中包含通过 Aria 眼镜记录的数千条双边对话,以鼓励对各种社交音频和视觉任务的研究。

MultiLora 推理服务器 (GitHub Repo)

https://github.com/predibase/lorax
Lorax 是一款推理服务器,支持将 LoRA 热插拔到单个基本模型上。 这意味着 RAM 的显着减少,同时支持各种模型调整。

评估游戏中的LLM (GitHub Repo)

https://github.com/jinhaoduan/gtbench
该项目引入了 GTBench,一个用于在各种游戏场景中测试 GPT-4 等 LLM 的平台,以发现其在策略推理方面的优势和劣势。 虽然这些模型在基于概率的游戏中显示出前景,但它们在确定性游戏中举步维艰,并且性能因设计和训练而异。


杂七杂八


多视图扩散++

https://mvdiffusion-plusplus.github.io/
扩散模型,可以生成对象的多个视图,然后将它们拼接在一起形成引人注目的 3D 版本。

为什么AI只会增加工作岗位而不是取代工作岗位的想法是一个谎言

https://donaldclarkplanb.blogspot.com/2024/02/this-is-why-idea-that-ai-will-just.html
人工智能将使部分劳动力实现自动化。 到目前为止,反应是双向的——这种效率是否意味着同样的人可以做更多的事情,还是更少的人做同样的任务? 本文探讨了技术对制造业和农业的影响与我们今天所看到的现代知识工作者的影响之间的比较。

多模式对话 (GitHub Repo)

https://github.com/sunsmarterjie/chatterbox
ChatterBox 是一种视觉语言模型,擅长多模态对话,特别是新建立的多模态多轮引用和基础任务。

苹果开发人工智能工具帮助开发者为应用程序编写代码

https://www.macrumors.com/2024/02/15/apple-xcode-ai-tool-for-coding/
Apple 正在开发 Xcode 的更新版本,其中将包含用于生成代码的 AI 工具。

AdGen AI (Product)

https://www.adgenai.com/
利用 AI 创建 100 多个高性能广告变体。

CrewAI

https://blog.replit.com/crew-ai
CrewAI 提供了一个库,用于构建和编排利用 LangChain 和 Replit 的 AI 代理。 它提供了包含代理、任务、工具和人员的模块化设置,以便轻松集成到各种项目中。 LangSmith 简化了调试,增强了对非确定性 LLM 调用的性能洞察。

相关文章

网友评论

      本文标题:2024-02-24 简讯 : 谷歌Deepmind开源基于Ge

      本文链接:https://www.haomeiwen.com/subject/hgmgadtx.html