Hive Hive是读时模式: 在传统数据库里,表的模式是在数据加载时强制确定的。如果在加载时发现数据不符合模式,...[作者空间]
每日的数据同步任务中,会将在线业务库的数据同步至 Hive,在刚上线的一段时间内,对 Hive 的 SQL 操作每...[作者空间]
一、什么是数据仓库 数据仓库(Data Warehouse,DW),是一种用于存储、分析和报告的数据系统,其目的是...[作者空间]
搭建单机hive环境 本文假设搭建的路径在/opt/sh路径,并已经下载hive安装包及hadoop安装包 htt...[作者空间]
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com...[作者空间]
Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。 但...[作者空间]
DataX简介 DataX 是阿里云 DataWorks数据集成[https://www.aliyun.com/p...[作者空间]
简单介绍 udf的全称是User Defined Function用户自定义函数,创建后可以直接在select语句...[作者空间]
需求:从性别、年龄、 职业、城市、居住年限,婚姻状况等维度找到高质量用户,并查看高质量用户人群的占比,为其提供高价...[作者空间]
前言: 以sql为基础,利用题目进行hive的语句练习,逐步体会sql与hive的不同之处。 题目用到hive的集...[作者空间]
1. 交集: select id from t1 join select id from t2 2. 并集 sel...[作者空间]
Hive 命令行 输入$HIVE_HOME/bin/hive –H 或者 –help可以显示帮助选项: -d,–d...[作者空间]