此篇内容:hive自定义函数UDF、UDTF,压缩存储方式,hive优化、hive实际编程SQL中的if表达式用法...[作者空间]
转载:原文地址 一、实时背景 在数据仓库建模中,未经任何加工处理的原始业务层数据,我们称之为ODS(Operati...[作者空间]
在编写mapreduce程序时,需要考虑的几个方面: 1.输入数据接口:InputFormat 默认使用的实现类是...[作者空间]
Hadoop是市面上使用最多的大数据分布式文件存储系统和分布式处理系统, 其中分为两大块分别是hdfs和MapRe...[作者空间]
一、 DDL 操作 启动服务: (一)数据库操作 1. 创建数据库 默认:创建的数据库将放在hdfs:/user/...[作者空间]
说明 其实hdfs 并不适合作为小文件的分布式存储系统 . 前人埋下的坑.... 背景 一次线上环境的hdfs ...[作者空间]
引言 在实际的kafka开发中,我们会发现,无论是生产者还是消费者,都需要构建一个Properties对象,里面设...[作者空间]
本文作者:林伟兵,叩丁狼高级讲师。原创文章,转载请注明出处。 1. 概述 随着大数据时代的来临,数据体量越...[作者空间]
一.基本功能: 1.启动hive时报错 解决方案: 2.启动hive时报错: 解决方案: 3.启动hive时报错 ...[作者空间]