美文网首页
2025-01-24 简讯 : DeepSeek如何改进了Tra

2025-01-24 简讯 : DeepSeek如何改进了Tra

作者: 数科每日 | 来源:发表于2025-01-22 21:26 被阅读0次

头条


DeepSeek如何改进了Transformer架构

https://epoch.ai/gradient-updates/how-has-deepseek-improved-the-transformer-architecture

DeepSeek是仅有的在生成模型底层架构上稳健创新的开源模型供应商之一。具体而言,其研究进展并非靠蛮力取得,而是源自那些清楚了解Transformer原理并基于此开展工作的团队 。

Mistral 的首次公开募股计划

https://finance.yahoo.com/news/buzzy-french-ai-startup-mistral-133915078.html

法国人工智能初创公司米斯特拉尔(Mistral)计划进行首次公开募股,而非被收购。它已筹集大量资金,完全有能力继续在全球提供服务,尤其是面向欧洲公司。

英伟达的 STEREO

https://nvlabs.github.io/FoundationStereo/

英伟达提出一种新方法,将基础模型与立体匹配技术相结合,以增强机器人和自动驾驶汽车的3D感知能力。


研究


地标定位工具包

https://arxiv.org/abs/2501.10098v1

这篇论文介绍了“landmarker”,它是一个基于PyTorch构建的Python软件包,为开发和评估地标定位算法提供了灵活的工具集。

具身基础模型

https://2toinf.github.io/UniAct/

UniAct是一种全新的具身基础建模框架,可在通用动作空间中运行。

海豚3.0(Hugging Face平台)

https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.1-8B

基于Llama 3.1 8B构建的新Dolphin模型,经过训练可通过系统提示接收指令。这意味着它在各种角色塑造和角色扮演方面表现出色,同时还保留了基础Llama模型本身的诸多能力。


工程


外科基础模型(GitHub 仓库)

https://github.com/timjaspers0801/surgenet

SurgeNet是一种新型手术基础模型,为手术计算机视觉设定了新标杆。

个人人工智能训练师(GitHub代码库)

https://github.com/riccardoriccio/fitness-ai-trainer-with-automatic-exercise-recognition-and-counting

这个项目提供直观的网页界面,让锻炼记录更轻松、更有效。

参数高效微调框架(GitHub 仓库)

https://github.com/jiaqihuang01/DETRIS

DETRIS在采用密集互连和文本适配器的多模态任务中,为未对齐的编码器增强视觉特征传播。


其他


企业为何需要人工智能查询引擎来推动智能代理式人工智能

https://blogs.nvidia.com/blog/ai-query-engines-agentic-ai/

人工智能查询引擎能让企业有效利用大量结构化和非结构化数据,弥合原始数据与人工智能应用之间的差距。它们具备多种数据处理、可扩展性、精准检索和持续学习等先进特性,提升了人工智能智能体的能力。像DataStax这样的公司已在借助这些引擎,为客户服务、视频搜索和软件分析等领域的应用提供支持 。

OpenAI #10:思考

https://thezvi.substack.com/p/openai-10-reflections

山姆·奥特曼谈及他意外被OpenAI董事会解雇一事,并反思其对公司治理和自身领导的影响。他回应了对OpenAI战略的批评,强调公司目标是安全地逐步实现通用人工智能(AGI),同时承认有高层离职。奥特曼分享了对AGI潜在风险的看法,并暗示到2025年实现人工智能与劳动力的融合,坚称OpenAI仍专注于打造超级智能系统以推动未来繁荣。

谷歌研究人员仅通过两小时访谈就能打造出思维与你极为相似的人工智能

https://gizmodo.com/google-researchers-can-create-an-ai-that-thinks-a-lot-like-you-after-just-a-two-hour-interview-2000547704

斯坦福大学的研究人员创建了人工智能代理,通过专门设计的界面采访1052人,能以85%的准确率复制人类行为。这项与谷歌DeepMind合作的研究表明,这些代理可以通过模拟对政策和产品发布的反应,帮助决策者了解公众意见。虽然人工智能代理在性格测试中表现出色,但在经济游戏中复制人类决策时却遇到了困难。

准备好迎接能与Twitch主播聊天并控制其直播的虚拟人工智能搭档吧

https://www.theverge.com/2025/1/6/24335356/virtual-ai-intelligent-streaming-assistant-inworld-streamlabs-nvidia

Inworld AI、Streamlabs和英伟达将为直播主播推出一款人工智能助手,提供实时技术支持,并担任懂游戏的联合主持人。

微软在Hugging Face上把强大的Phi-4模型完全开源了

https://links.tldrnewsletter.com/V3b9dN

微软已在Hugging Face上开源其Phi-4模型,该模型因在推理任务中的高效性和高性能而受到称赞。

人工智能利用喉咙振动来弄清楚人们想说什么

https://www.newscientist.com/article/2458385-ai-uses-throat-vibrations-to-work-out-what-someone-is-trying-to-say/

人工智能可通过解读喉部振动,帮助中风和帕金森病患者进行交流。

相关文章

网友评论

      本文标题:2025-01-24 简讯 : DeepSeek如何改进了Tra

      本文链接:https://www.haomeiwen.com/subject/higcujtx.html