集群安装ik分词器 对中文进行分词 ik分词器和es版本有严格要求 参考资料 elasticsearch集成ik分...[作者空间]
CURL命令 在命令行下访问url的一个工具(理解为浏览器)可以简单实现常见的get/post请求-X 指定ht...[作者空间]
只允许普通用户操作,不允许root用户 Hadoop2.0集群配置情况 安装部署 在node002、node003...[作者空间]
本地模式 开启本地模式:set hive.exec.mode.local.auto=true;hive.exec....[作者空间]
Hive运行方式 命令行方式cli:控制台模式 脚本运行方式(实际生产环境中用最多,不可人为控制,只能根据时间定时...[作者空间]
Hive View视图 不支持物化视图,物理文件并不存在!虚拟表也是表,但能显示出来 只能查询,不能做加载数据操作...[作者空间]
Hive分桶 分桶表是对列值取哈希值的方式,将不同数据放到不同文件中存储。 对于hive中每一个表、分区都可以进一...[作者空间]
Hive 参数、变量 hive当中的参数、变量,都是以命名空间开头通过${}方式进行引用,其中system、env...[作者空间]
HBase客户端Java-API 生产通话记录 统计二月份到三月份的通话记录 查询某个手机号主叫为1 的所有记录 ...[作者空间]
环境准备 (1)制作hbase的用户库,并导入(2)导入hadoop用户库(3)导入Junit测试库(4)src目...[作者空间]
HBASE Shell的DDL操作 HBASE Shell的DML操作 获取一条记录 更新记录 HBase She...[作者空间]
第二次以后启动集群:先启动zkServer.sh start(默认已经启动?),再start-dfs.sh,再st...[作者空间]
Hive SerDe - Serializer and Deserializer SerDe 用于做序列化和反序列...[作者空间]
hive的元数据要保存到mysql里,hdfs上就是文件,没有定义各种数据格式将文件格式化读取,必须要有区分字符h...[作者空间]
是简单的好友列表的差集吗?最应该推荐的好友TopN,如何排名? 熟悉API 会分析数据 好友数据 好友推荐FOF只...[作者空间]
思考 自定义类型分区排序比较器 数据案例 top-K:找出每月气温最高的2天 自定义类型 Map阶段 分组 对ke...[作者空间]
分布式应用开发,计算向数据移动 在eclipse 上也可直接运行![作者空间]
参考单节点 Single Node Setup YARN的配置第二次以后启动:先启动zk,再start-dfs.s...[作者空间]
API的封装,越来越趋向人类容易和简单使用 Window开发环境 (1)部署hadoop包创建:C:\usr\ (...[作者空间]
Hadoop集群基础配置 hadoop伪分布式系统配置VM安装Linux虚拟机环境VM克隆Linux虚拟机集群配置...[作者空间]