在大数据分析中,将两个数据集进行 Join 操作是很常见的场景。在 Spark 的物理计划阶段,Spark 的 J...[作者空间]
说到哈希算法,可能大部分人都会不自觉得想到 md 和 sha 系列,在这之前,我就是这样的,因为他们意味着流行安全...[作者空间]
1. 乐观锁和悲观锁 悲观锁 总是假设最坏的情况,为防止每次去拿数据别人修改,每次在拿数据的时候都会上锁,这样别人...[作者空间]
spark streaming在yarn-client或者本地local执行的时候,由于长时间运行日志会越来越多,...[作者空间]
系统运行缓慢,CPU 100%,以及Full GC次数过多问题的排查思路 1. Full GC次数过多 2. CP...[作者空间]
一、Druid介绍 Druid 是 MetaMarket 公司研发,专为海量数据集上的做高性能 OLAP (OnL...[作者空间]
1.启动 1.1 启动总入口 从上节flume1.9源码分析(一)从编译到启动 中可知,flume的启动方式分为两...[作者空间]
1.面试相关 基础知识 https://github.com/CyC2018/CS-Notes 50K star...[作者空间]
OLAP简介 摘要 druid对于做大数据的同学们来说,并不陌生。我之前也研究过很多OLAP的框架,最近研究了一下...[作者空间]
前言 今天流式数据处理在大数据领域是一件大事,理由如下: 1、企业渴望更加及时的数据,而且采用流式处理是降低延迟的...[作者空间]
我忘记是在哪里看到,还是自以为的,反正目前我依然是这么想的: 广义数据仓库的建设包含很多的解决方案,其中就包含数据...[作者空间]
话说,没有规矩不成方圆。在搭建数据平台的时候,在数据组内部,一定要先制定好各种规范,越早越好,并且不断的监督大家是...[作者空间]
你好,2019 再见,2018 又到了一年辞旧迎新的时候,大家应该也和美美一样,在忙着总结回顾和展望规划吧。 按老...[作者空间]
作者:敏丞 前言 在上篇文章里,我们比较了 Kylin 和 Druid 这两个重要的 OLAP引擎的特点,也分析了...[作者空间]
最近抽风,没事会在知乎上回答一些问题,也许是想在这个世界上多留下点痕迹吧 :) 几次看到类似这样的题目: 作为一个...[作者空间]
前言 在微服务大行其道的今天,分布式系统越来越重要,实现服务化首先就要考虑服务之间的通信问题。这里面涉及序列化、反...[作者空间]
作者 | 小米大数据 如今的小米不仅是一家手机公司,更是一家大数据与人工智能公司。随着小米公司各项业务的快速发展,...[作者空间]
我们知道Druid能够同时提供对大数据集的实时摄入和高效复杂查询的性能,主要原因就是它独到的架构设计和基于Data...[作者空间]
Druid基本概念及架构介绍 1.什么是Druid Druid是一个专为大型数据集上的高性能切片和OLAP分析而设...[作者空间]
背景介绍 相信凡是关注容器生态圈的人都不会否认,Kubernetes 已经成为容器编排调度的实际标准,不论 Doc...[作者空间]