druid是目前比较流行的高性能的,分布式列存储的OLAP(数据库的级联查询)框架。(比较主流的分布式数据库操作工具)
Druid具有以下特点:
1亚秒级OLAP查询
包括多维过滤、ad-hoc的属性分组、快速聚合数据等等。
2实时的数据注入
真正做到数据摄入实时、查询结果实时。(保证数据有效性,实现数据的统一)
3高效的多租户
(用户连接数据库的周期——持续时间的长短——租期——多久连接数据库不断开,过了租期断掉连接,只要连接上就能快速查询)能力,最高可以做到几千用户同时在线查询。
4可扩展PB存储
千亿级事件快速处理,支持每秒数千查询并发。(每秒百万级的数据注入)
5多环境部署
druid集群可以很方便的扩展到PB的数据量,每秒百万级别的数据注入。即便在大数据规模的情况下,也能保证其时效性。
6丰富的社区
druid拥有丰富的社区共大家学习。
淘宝阿里数据库支持每秒42万次的写库操作。(支持实时入库)
Druid的功能
1、替换DBCP和C3P0。Druid提供了一个高效、功能强大、可扩展性好的数据库连接池。
2、可以监控数据库访问性能,Druid内置提供了一个功能强大的StatFilter插件,能够详细统计SQL的执行性能,这对于线上分析数据库访问性能有帮助。
3、数据库密码加密。直接把数据库密码写在配置文件中,这是不好的行为,容易导致安全问题。DruidDruiver和DruidDataSource都支持PasswordCallback。
4、SQL执行日志,Druid提供了不同的LogFilter,能够支持Common-Logging、Log4j和JdkLog,你可以按需要选择相应的LogFilter,监控你应用的数据库访问情况。
5、扩展JDBC,如果你要对JDBC层有编程的需求,可以通过Druid提供的Filter机制,很方便编写JDBC层的扩展插件。


Realtime 组件负责数据的实时摄入。
Broker 阶段负责查询任务的分发以及查询结果的汇总,并将结果返回给用户。
Historical节点负责索引后的历史数据的存储,数据存储在deep storage。deep storage可以是本地,也可以是HDFS等分布式文件系统。
Indexing service 包含两个组件(图中未画出)。Overlord 组件负责索引任务的管理、分发。
MiddleManager 负责索引任务的具体执行。
网友评论