大数据已死。或者说,MotherDuck 是基于 DuckDB 的无服务器分析平台的构建者。该公司的创始人表示,他们从现实世界的用户那里了解到,由于最近的硬件进步,绝大多数工作负载不需要大数据分布式计算的高额管理费用。
“事实是,‘大数据’已经死了;MotherDuck 的首席执行官兼联合创始人 Jordan Tigani在一份新闻稿中说:“理解数据的简单性和易用性比数据的大小重要得多。 ”
Tigani 的公司刚刚筹集了 4750 万美元,并与DuckDB Labs(由 DuckDB 的创建者创立)合作,构建基于 DuckDB 的无服务器云分析平台。该公司表示,这笔资金将用于进一步推进这种合作,以及建立其工程和 GTM 团队。
“今天的笔记本电脑比数据仓库更快。随着硬件的进步,大多数工作负载不再需要分布式计算,”Tigani 说。“云数据供应商专注于 100TB 查询的性能,这不仅与绝大多数用户无关,而且会分散供应商提供出色用户体验的能力。我们正在利用 DuckDB 的强大功能,并将其与无服务器分析相结合,以帮助轻松扩展和缩减规模。”
DuckDB是一个开源的进程内数据库,类似于用于分析工作负载的 SQLite。根据 MotherDuck 的说法,SQL OLAP 数据库管理系统已获得广泛采用,因为它能够在任何地方(包括浏览器)运行,无需预加载即可从任何地方查询数据,并根据最新的学术研究执行快速分析查询。根据 DuckDB 的说法,OLAP 工作负载很复杂,长时间运行的查询处理存储数据集的重要部分,并且通过附加几行来更改数据,或者同时更改或添加大部分表。
“为了有效地支持这种工作负载,减少每个单独值所花费的 CPU 周期数至关重要。实现这一目标的数据管理技术水平是矢量化或即时查询执行引擎。DuckDB 包含一个列式矢量化查询执行引擎,该引擎仍会解释查询,但会在一次操作中处理大量值(“向量”),”DuckDB网站说。“这大大减少了传统系统(如 PostgreSQL、MySQL 或 SQLite)中按顺序处理每一行的开销。向量化查询执行可显着提高 OLAP 查询的性能。”
在公司博客中,DuckDB Labs 评论了与 MotherDuck 合作的愿景:“当最终导致 DuckDB 的第一个想法被抛出时,我们违背了行业和研究中的普遍智慧,即只有大规模和分布式数据处理将是前进的方向。从我们与数据从业者的互动中,我们开始相信,虽然存在大量数据集,但它们大多存在于已经拥有处理它们的技术专长的组织中。我们押注于高效且符合人体工程学的单节点分析,我们很高兴 MotherDuck 团队认同这一愿景,尤其是考虑到该团队的背景。”
DuckDB Labs 由 Hannes Mühleisen 和 Mark Raasveldt 创立,为 DuckDB 提供服务和开发。Mühleisen 和 Raasveldt 是 Centrum Wiskunde & Informatica (CWI) 数据库架构研究小组的研究人员,当时他们在 2019 年发布了 DuckDB 的第一个版本。
“DuckDB 之所以得名,是因为我曾经养过一只宠物鸭,”Mühleisen 在CWI 撰写的关于该公司的简介中说道。“鸭子是神奇的动物。它们能飞、能走、能游泳,而且对环境挑战的适应能力很强。因此,它们是多功能且有弹性的数据管理系统的完美吉祥物。”
对 DuckDB 的兴趣正在增长,正如在 Twitter 上发现的这个模因所证明的那样。
对 DuckDB 的兴趣似乎在增长。据 MotherDuck 称,DuckDB 的DB Engines分数每月增长 40%,而其 Python 发行版同时下载量为 400K。
MotherDuck 的 4750 万美元资金包括由 Andreessen Horowitz 领投的 3500 万美元 A 轮融资,以及由 Redpoint Ventures 领投的 1250 万美元种子轮融资,使公司的总估值达到 1.75 亿美元。其他投资者包括 Madrona、Amplify Partners 和 Altimeter。
Redpoint Ventures 的 Tomasz Tunguz 表示:“我们看到了 MotherDuck 的巨大潜力——不仅在于它们所代表的市场,还在于构建这个改变游戏规则的平台的人才素质。” “我们很高兴能与团队合作,将 DuckDB 的强大功能带给比以往更多的人。”
原文来自:
https://www.datanami.com/2022/11/16/is-big-data-dead-motherduck-raises-47m-to-prove-it/
网友评论