Cloudera Manager 是 CDH 市场领先的管理平台。它以其强大的数据管理和分析能力,帮助企业能够轻松...[作者空间]
hive的map数量和reduce数量控制 参考文档: https://blog.csdn.net/may_fly...[作者空间]
一、安装hive前提条件 hive运行在hadoop集群上,所以先要确保你的hadoop集群已经安装完毕并且可正常...[作者空间]
1 场景 1.1 目的 centos7环境下安装分布式hadoop。hadoop版本:2.7.1。 1.2 准备工...[作者空间]
希望你能看到文末,不会让你失望的! 毋庸置疑数据会是企业未来经营发展的一个中枢。 企业发展数据需要人和团队,试想如...[作者空间]
LDAP介绍 LDAP概述 LDAP是轻量目录访问协议,(LDAP, Lightweight Director...[作者空间]
记录常用的kafka常用的topic相关命令 查看topic列表 创建topic --create:创建命令;--...[作者空间]
01.第一部分:大数据的基础介绍 02.第二部分:大数据带来的影响 03.第三部分:CentOS系统和Cloude...[作者空间]
昨天有网友问我: 大型传统企业如何在公司级数据整合、数据治理、数据运营中把握好业务和数据的关系,逐步实现智能化转型...[作者空间]
配置微软Azure大数据HDInsight云集群,存储账户、托管标识等问题也都参考官方文档解决了。原文在我的开源中...[作者空间]
https://blog.csdn.net/hsf15768615284/article/details/1040...[作者空间]
一、mapreduce过程资源优化 要了解mapreduce的资源优化,首先应该要熟悉整个mapreduce的过程...[作者空间]
一、MapReduce2工作机制 1.1、MapReduce2的架构图 1.2、MapReduce2运作步骤 说在...[作者空间]
上传zookeeper安装包到集群中的任意一台机器上 解压tar -zxvf zookeeper-3.4.5.ta...[作者空间]
HA简介HA是High Available缩写,是双机集群系统简称,指高可用性集群,是保证业务连续性的有效解决方案...[作者空间]
准备Linux环境 修改主机名 vi /etc/sysconfig/network NETWORKKING = y...[作者空间]
Ambari和CDH一样,是较为流行的hadoop管理工具(虽然Hortonworks已经被Cloudera收购了...[作者空间]
分桶字段选择 进行分桶之前需要对表的数据分布情况进行大致的分析,一般遵循的原则为,选择离散度高的字段进行分桶。可以...[作者空间]
本文种记录的大多是开源版本hive调优方式 我也会补充TDH集群Inceptor的优化方式 面试必备技能-Hive...[作者空间]
背景篇 目前所在项目中,人员配置:项目经理(4)业务分析师报表开发工程师(2,4)etl工程师大数据开发工程师(4...[作者空间]