Checkpointing 是 Flink 故障恢复的内部机制。一个 checkpoint 就是 Flink应用程...[作者空间]
一.Spark架构 1.Spark架构中的组件 2.spark架构揭示了spark的具体流程如下: 二.RDD 1...[作者空间]
目录一.RDD基础1.什么是RDD2.RDD的属性3.RDD的创建方式4.RDD的类型5.RDD的基本原理二.Tr...[作者空间]
Hive概述 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供...[作者空间]
hive的使用方式 1.使用CLI 直接使用hive命令即可进入客户端。 2. 使用hiveserver2服务 修...[作者空间]
目前针对SQL on ElasticSearch 已经有了比较好的解决方案:elasticsearch-sql,其...[作者空间]
Hive是什么? Hive是一种基于Hadoop的数据库技术并提供完整的sql查询功能, . HIVE能做什么? ...[作者空间]
Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...[作者空间]
Spark Streaming 编程指南 概述 一个入门示例 基础概念 依赖 初始化 StreamingConte...[作者空间]
Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...[作者空间]
Spark Streaming 编程指南1.概述Spark Streaming 是 Spark Core API ...[作者空间]
最近学习了一个分布式爬虫系统 Frontera,其中通信载体使用的是 kafka。之前只是听说 kafka 很 ?...[作者空间]
软件环境: 主机配置: 一共m1, m2, m3这五部机, 每部主机的用户名都为centos 前期准备 1.配置主...[作者空间]