https://my.oschina.net/keking/blog/3007189[作者空间]
1,离线数据处理:项目内容为通过对网站访问日志的采集和清洗,结合数据库中的结构化用户数据,统计并展示网站的PV、U...[作者空间]
UDF可以构造简单的函数来得到我们想要的数据输出,作用就是加工数据。 实例: package udf;import...[作者空间]
大数据采集、清洗、处理:使用MapReduce进行离线数据分析完整案例 - 柯南爱上指针的博客 - CSDN博客 ...[作者空间]
简介 Spark Streaming是Spark Core的扩展,是构建于Spark Core之上的实时流处理系统...[作者空间]
Hive内部表和外部表的区别详解 - CSDN博客 1.内部表 create tabletest (name st...[作者空间]