更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据仓库工程师是什么 首先,我要声明一点,数仓工程师不能有一个...[作者空间]
肝了几个晚上,梳理总结了一份万字长文超详述hive企业级优化文章,也整理了一份hive优化总结思维导图和hive优...[作者空间]
更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据湖是什么 数据湖相当于一个汇集着来自各个异构数据源的原生态...[作者空间]
前言 看了很多zookeeper的文章和视频,几乎前篇一律先讲一遍基本使用再讲使用场景,看完还是云里雾里。所以本文...[作者空间]
一、HBase简介 1.1 定义 1.2 HBase数据模型 1.2.1 HBase逻辑结构 1.2.2 HBas...[作者空间]
一、zookeeper入门 1.1 概述 1.2 zookeeper特点 1.3 zookeeper数据结构 1....[作者空间]
0.补充 0.1 什么是hive 0.2 优缺点 0.3 Hive架构原理 0.4 hive与数据库的比较 由于 ...[作者空间]
需求:从性别、年龄、 职业、城市、居住年限,婚姻状况等维度找到高质量用户,并查看高质量用户人群的占比,为其提供高价...[作者空间]
1. 用户指标体系(人) 基础指标体系 + RFM模型分析 1.1 基础指标(uv/pv/留存率) 1.1.1 搭...[作者空间]
此篇内容:hive自定义函数UDF、UDTF,压缩存储方式,hive优化、hive实际编程SQL中的if表达式用法...[作者空间]
目录 为什么需要消息队列 1.异步 :一个下单流程,你需要扣积分,扣优惠卷,发短信等,有些耗时又不需要立即处理的事...[作者空间]
1.什么是分布式锁 一般的锁:一般我们说的锁是但进程多线程的锁,在多线程并发编程中,用于线程之间的数据同步,保护共...[作者空间]
ZooKeeper 典型应用场景-数据发布与订阅 ZooKeeper 是一个高可用的分布式数据管理与系统协调框架。...[作者空间]
通过 VMware ,我们安装了三台虚拟机,用来搭建 zookeeper 集群,虚拟机网络地址如下: hostna...[作者空间]
ZooKeeper是一个开源的分布式应用程序协调服务,是Google的Chubby一个开源的实现。ZooKeepe...[作者空间]
1. 数据模型 1.1. 只适合存储小数据 Zk维护着一个逻辑上的树形层次结构,树中的节点称为znode,个zno...[作者空间]
ZooKeeper快速入门 1. 概述 Zookeeper是Hadoop的一个子项目,它是分布式系统中的协调系统,...[作者空间]
背景 DataX 是一个进程一个日志,不同于其他日志一天一个日志,合并到一个日志中进行压缩在查看日志时有一定的不便...[作者空间]
更多:生产环境Rabbitmq集群安装 创建用户 创建用户名sudo adduser rabbitmq 添加到su...[作者空间]
2017年前后留在旧笔记本电脑里的笔记,先发布后修改。 一. 建表 建表语句示例: CREATE TABLE IF...[作者空间]