hadoop主要组件有hdfs、yarn,hdfs是分布式文件系统,主要是进行文件的存储,而yarn是hadoop...[作者空间]
开始学习Hadoop时,经常会听到MapReduce。MapReduce由Map和Reduce两个阶段,每个阶段都...[作者空间]
hive作为数据仓库工具,可以查看HDFS结构化文件内容,使用sql进行数据加工处理。在使用hive进行数据查询时...[作者空间]
在hive中进行数据处理和查询时,常用又比较生僻sql整理。 group by and having group ...[作者空间]
在使用hive进行数据加工处理时,经常要进行两个数据表join关联,接下来具体介绍hive sql中要使用的joi...[作者空间]
spark streaming+kafka 0.10集成默认spark partition和kafka pa...[作者空间]