参数说明 参数解释默认值tickTime节点间信号发送的时间间隔,每个tickTime会发送一次心跳,单位为ms;...[作者空间]
在hbase shell中创建表时发生报错’Master is initializing‘ 查看当前hbase的活...[作者空间]
1.停止CDH集群服务 所有节点执行 主节点执行 2.修改mysql中scm元数据 在配置的mysql中连接scm...[作者空间]
此次过程为:通过centos镜像,创建三个容器,在三个容器中搭建一个小型的cdh集群。 centos已经具备,接下...[作者空间]
HBase Shell是HBase的命令行工具,提供了对HBase的管理操作,可以对HBase中的表进行数据的增、...[作者空间]
在处理时序数据时,会遇到缺失数据的情况,在Dataset数据填充中会有均值填充、最大值填充、最小值填充,但业务要求...[作者空间]
不废话,直接上东西 由于工程使用maven建立的 pom.xml文件 代码:[作者空间]
一、redis资源池的使用 以maven工程为例pom.xml配置文件 代码 二、配置 redis资源池中的配置有...[作者空间]
CDH数据加密概述 加密是使用数字密钥对各种组件进行编码的过程,因此只有适当的实体才能进行解码,然后查看,修改或添...[作者空间]
在Yarn上提交Spark任务,在提交时命令为 理论上提交的资源应该为内存1.5g,虚拟CPU2。但是提交到Yar...[作者空间]
1.Yarn上的角色 1.1.Client 客户端,接收作业请求。接收请求后向RM(Resource Manage...[作者空间]
Cloudera Manager管理页面中是无法查看kafka的 版本号,这样我们在写程序的时候无法知道对应的ka...[作者空间]
基本的命令 1、创建topic replication-factor,为副本数;partitions,为分片数,分...[作者空间]
在命令行启动spark-shell时,发生报错 查看日志可以发现是因为org.apache.hadoop.secu...[作者空间]
一、什么是纠错码 提起纠错码就有必要提起HDFS中多副本策略。在多副本策略下,HDFS中储存文件,要存储三份相同文...[作者空间]
安装HDFS后,报了一个隐患 9 DataNodes are required for the erasure c...[作者空间]
一、Spark是什么? 是一个基于内存计算的开源的集群计算系统,Spark 启用了内存分布数据集,除了能够提供交互...[作者空间]
一、HBase是什么? HBase 是一个开源的、分布式的、版本化的 NoSQL 数据库(也即非关系型数据库),它...[作者空间]
一、KAFKA是什么? Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。...[作者空间]
一、YARN是什么? Apache Hadoop YARN (Yet Another Resource Negot...[作者空间]