what is presto?
Presto是一个开源的分布式SQL查询引擎,用于对各种大小的数据源(从GB到PB)运行交互式分析查询。
Presto是为交互分析而设计和编写的,即使数据规模能达到facebook这种程度,presto的速度也能接近于商业数据仓库。
what can it do?
Presto可以从Hive、Cassandra、关系型数据库甚至是商业数据存储中进行查询。一个Presto的查询可以组合来自多个数据源的数据,并且允许跨组织进行分析。
Presto的目标用户是那些希望查询能在秒级到分钟级响应的数据分析师。除了使用昂贵的商业软件,或者堆硬件的方式,Presto是另一种选择。
what presto is not?
Presto不是一般意义上的关系型数据库。它并不是Mysql、PostgreSql或Oracle的替代品。Presto不是为OLTP设计的,而是为OLAP设计的。
Presto是一个用来在大规模数据上进行高效查询的分布式工具。Presto的设计初衷是为了替代Hive和Pig(使用MapReduce进行查询),但Presto并不局限于访问HDFS。
网友评论