常见问题 YARN集群还有资源,为什么部分任务还是一直处于ACCEPT状态? 大数据集群还剩有很多资源,部分任务还...[作者空间]
普通查询: 三个排序: 四个分析函数: 放置位置select之前from之后. 当前行跟其他行级联求各种的五个函数...[作者空间]
HQL语句 删除查看语句: 创建语句: 创建内部/外部表 区别:删除表时外部表只会删除元数据不会删除数据本身. h...[作者空间]
LDAP介绍 LDAP概述 LDAP是轻量目录访问协议,(LDAP, Lightweight Director...[作者空间]
配置微软Azure大数据HDInsight云集群,存储账户、托管标识等问题也都参考官方文档解决了。原文在我的开源中...[作者空间]
https://blog.csdn.net/hsf15768615284/article/details/1040...[作者空间]
一、mapreduce过程资源优化 要了解mapreduce的资源优化,首先应该要熟悉整个mapreduce的过程...[作者空间]
一、MapReduce2工作机制 1.1、MapReduce2的架构图 1.2、MapReduce2运作步骤 说在...[作者空间]
Ambari和CDH一样,是较为流行的hadoop管理工具(虽然Hortonworks已经被Cloudera收购了...[作者空间]
工作中需要使用Java API来连接Sentry,但是很神奇地发现Sentry的官网没有API文档,经过一番搜索和...[作者空间]
Java坦克大战300集项目 Java坦克大战300集分为19个阶段,大家按照这个学习路线学习。 坦克大战第一节 ...[作者空间]
一、写数据流程图 该流程主要是客户端开始写数据,然后把数据切分多个chunk,多个chunk组成一个packet,...[作者空间]
一、客户端创建写文件的流程图 namenode主要创建客户端RPC请求的准写的文件,namenode会把文件名保存...[作者空间]
一、hdfs读取流程图 假设block副本个数3个 客户端发起请求到namenode节点,要求namenode告诉...[作者空间]
一、通讯流程图 二、Sender客户端解析 1、RemoteBlockReader2.newBlockReader...[作者空间]
一、YARN的诞生 在hadoop1.0版本是没有yarn的概念的,而在hadoop2.0版本以上才出现了yarn...[作者空间]
一、hdfs读取流程 先获取文件流FSDataInputStream fsIn = FileSystem.open...[作者空间]
安装JDK: 下载 jdk-8u221-linux-x64.tar.gz。 解压 tar -xzvf jdk-8u...[作者空间]
大数据架构是用于摄取和处理大量数据(通常称为“大数据”)的总体系统,因此可以针对业务目的进行分析。该架构可视为基于...[作者空间]
一、什么是数据倾斜 正常的数据分布,在理论上都是数据倾斜的。数据倾斜是大量的相同key被partition分配到一...[作者空间]