139.1 Spark MLllib MLlib(Machine Learnig lib) 是Spark对常用的机...[作者空间]
138.1 PaddlePaddle PaddlePaddle是百度开源的一个深度学习平台 PaddlePaddl...[作者空间]
137.1 数据导出 Sqoop可以对HDFS文件进行导入导出到关系型数据库 Sqoop 工作机制是将导入或导出命...[作者空间]
136.1 数据建模 维度建模 专门适用于OLAP的设计模式存在着两种类型的表:事实表 维度表事实表:主题的客观度...[作者空间]
应用场景用户流失预警系统基于用户购买的挽回系统用户特征和规则提取系统数据分析系统用户画像系统 流程数据采集数据预处...[作者空间]
134.1 实时流计算介绍 所谓实时流计算,就是近几年由于数据得到广泛应用之后,在数据持久性建模不满足现状的情况下...[作者空间]
133.1 Keepalived安装 在MySQLA和MySQLB安装Keepalived服务 加入开机自启 13...[作者空间]
1.主节点与备节点均已安装OpenLDAP且正常使用2.集群已启用Kerberos 132.1 hive用户导入到...[作者空间]
Apache Avro 是一个数据序列化系统,Avro提供Java、Python、C、C++、C#等语言API接口...[作者空间]
128.1 安装及配置 安装环境及版本Redhat版本为7.3OpenLDAP版本为2.4.44 在集群中选择一台...[作者空间]
127.1 流程图 127.2 Solr中建立collection Solr collection的schema文...[作者空间]
125.1 SNMP安装 安装SNMP告警接收服务,命令如下: /etc/snmp/snmptrapd.conf配...[作者空间]
环境介绍非Kerberos环境CM和CDH均为:5.15 准备环境 Spark2Streaming示例pom.xm...[作者空间]
123.1 问题情况 前提Impala Daemon已启用-convert_legacy_hive_parquet...[作者空间]
122.1 Spark Thrift部署 下载地址: 解压 拷贝至/opt/cloudera/parcels/SP...[作者空间]
异常情况 hive中创建一个表 插入中文字符 Hive使用正常 Impala查询 数据生成的hdfs文件的编码 解...[作者空间]
两种方式具体架构如下图: 注:所有Hadoop节点同时配置有两个网段,用于内网通信的192网段以及用于外网的172...[作者空间]
Hive与Spark的版本兼容性: 测试Spark服务是否正常 spark-assembly.jar包软连至${H...[作者空间]
CDH集群 原HOSTNAMEip-xxx-xx-x-xx.fayson.com 修改为cdh04.fayson....[作者空间]
116.1 问题简述 Hive创建的Parquet格式的表,重命名表的列名后,查询重名的列数据时显示当前列所有值为...[作者空间]