配置微软Azure大数据HDInsight云集群,存储账户、托管标识等问题也都参考官方文档解决了。原文在我的开源中...[作者空间]
一、读取block数据方法流转 传输数据是通过scoket建立的,Sender和Receiver,这两个方法都继承...[作者空间]
简介 同Hive Hook一样,Presto也支持自定义实现Event Listener,用于侦听Presto引擎...[作者空间]
Presto因其优秀的查询速度被我们所熟知,它本身基于MPP架构,可以快速的对Hive数据进行查询,同时支持扩展C...[作者空间]
之前我们提到大数据的时候就会提到Hadoop,Hadoop是大数据的基础框架,是大数据技术的代表。提到HDFS、M...[作者空间]
Hive作为SQL on Hadoop最稳定、应用最广泛的查询引擎被大家所熟知。但是由于基于MapReduce,查...[作者空间]
前言 数据时代,数据的多源集成和快速检索查询是第一步,配上数据分析及可视化才能算窥得大数据一角。 创建这个项目的主...[作者空间]
文章导读: 什么是RBO? 什么是CBO? 我们在工作中经常会听到这样的声音:“SQL查询慢?你给数据库加个索引啊...[作者空间]
文章导读: 什么是Calcite? Calcite的主要功能? 如何快速使用Calcite? 什么是Calcite...[作者空间]
狭义hadoop: 一个适合大数据分布式存储和分布式计算的平台,包含HDFS,MapReduce,YARN广义ha...[作者空间]
Nutch->Hadoop(yahoo) 第一章 初识Hadoop 分治,多机器并行I/O数据 问题1:硬件故障数...[作者空间]
文章导读:对称加密非对称加密数字证书Kerberos认证流程 Hadoop生态利用Kerberos认证机制来识别可...[作者空间]
Zookeeper作为一个分布式协调系统提供了一项基本服务:分布式锁服务,分布式锁是分布式协调技术实现的核心内容。...[作者空间]
问题导读:Gobblin的架构设计是怎样的?Gobblin拥有哪些组建,如何实现可扩展?Gobblin采集执行流程...[作者空间]
问题导读:Hadoop数据采集框架都有哪些?Hadoop数据采集框架异同及适用场景? Hadoop提供了一个高度容...[作者空间]
原创,转载请标明出处: https://www.jianshu.com/p/c39596da86bb 本文主要关于...[作者空间]
没有套路真的是送!! 大家都知道,大数据行业spark很重要,而学spark又必须得会scala(别跟我扯用JAV...[作者空间]
前面我们提到的HDFS,了解了HDFS的特性和架构。HDFS能够存储TB甚至PB规模的数据是有前提的,首先数据要以...[作者空间]
前面我们提到了Ceph是一个支持统一存储架构的分布式存储服务。简单介绍了Ceph的基本概念和基础架构包含的组件,其...[作者空间]
有人问我,你是如何做到统一存储的?我微微一笑,大声告诉他:Ceph在手,天下我有。 Ceph是一个统一的分布式存储...[作者空间]