Apache推出Google Dremel的开源版本Drill-CSDN.NET
http://www.csdn.net/article/2012-08-20/2808871
大数据面临的一个很大的问题是大多数分析查询都很缓慢且非交互式。Google的Dremel能以极快的速度处理网络规模的海量数据。据谷歌的研究报告显示,Dremel能以拍字节(petabyte,PB,1PB等于1024TB)的数量级来进行查询,而且只需几秒钟时间就能完成。而其对应的开源版本就是Drill。
在大数据时代,对于Hadoop中的信息,越来越多的用户需要能够获得快速且互动的分析方法。现在,谷歌正在使用Dremel工具来快速分析事务,而Apache基金会则支持了一个类似于Dremel的开源版本——Drill。(CSDN编者注:Dremel是一种用来分析信息的方法,它可以在数以千计的服务器上运行,允许你“请求查询”海量数据,如网络文件的集合或是数字图书馆等,甚至是描述成百上千万条垃圾游戏信息的数据。这类似于分析一个使用SQ语言L的传统数据库。而Dremel能以极快的速度处理网络规模的海量数据。据谷歌的研究报告显示,你能以PB数量级来进行查询,而且只需几秒钟时间就能完成。)在Apache基金会文档中如此描述:Drill,一个专为互动分析大型数据集的分布式系统。
网友评论