大数据经典学习路线(及供参考)之 二

作者: 柯西带你学编程 | 来源:发表于2018-05-22 19:19 被阅读60次

    2.1 数据仓库增强

    2.1.1 数据仓库及数据模型入门

    什么是数据仓库、数据仓库的意义、数据仓库核心概念、数据仓库的体系结构

    2.1.2 数据仓库设计

    建立数据仓库的步骤、数据的抽取、数据的转换、数据的加载、什么是数据模型、数据模型的常见类型、如何设计数据模型、如何选择数据建模的架构

    典型数据模型——星型建模实例

    2.1.3 数据仓库建模样例

    业务建模、领域建模、逻辑建模、物理建模

    web点击流日志分析系统数据仓库设计实战:

    通过对数据特点和业务需求的分析,关系梳理,设计出一个主题明确、层次合理的数据模型

    2.2 离线辅助系统

    2.2.1 数据采集系统

    数据采集概念介绍

    FLUME日志采集框架介绍、FLUME工作机制、FLUME核心组件、FLUME参数配置说明、FLUME采集nginx日志实战案例

    2.2.2 任务调度系统

    任务调度系统概念介绍、常用任务调度工具比较、OOZIE介绍、OOZIE核心概念、OOZIE的配置说明、OOIZE实现mapreduce/hive等任务调度实战案例

    2.2.3 数据导出

    数据导出概念介绍、SQOOP基础知识、SQOOP原理及配置说明、SQOOP数据导入实战、SQOOP数据导出实战、SQOOP批量作业操作


    2.3 web点击流日志分析系统实战项目


    2.3.1 项目介绍

    1. 在PC时代,营销的核心是购买,在移动互联网时代,其核心是如何实现用户个性化互动,对用户传播更为精准化的内容,而实现这一核心的基础就是对数据的管理和分析——数据驱动型商业模型。

    2. 各类互联网服务产品(如网站、APP)都可以通过前端技术获取用户的详细行为数据(如访问的页面,点击的区域、登陆的频次、注册行为、购买的行为等),将这些点击流日志数据与后台商业数据综合起来,就可以挖掘对公司运营决策意义非凡的商业价值。

    3. 本项目则是一个用大数据技术平台实现的点击流日志分析数据挖掘系统,项目内容涵盖一个典型数据挖掘系统中,包括需求分析、数据采集、数据存储管理、数据清洗、数据仓库设计、ETL、业务模型统计分析、数据可视化的全部流程。

    2.3.2 需求分析

    什么是点击流日志、点击流日志的商业价值、点击流日志分析需求

    业务模型指标体系设计——流量分析、来源分析、受访分析、访客分析、转化率分析

    2.3.3 系统设计及开发

    1. 系统架构设计

    2. 数据采集设计及开发——数据格式、数据内容分析、数据生成规律、采集系统技术选型解析、FLUME采集系统实现

    3. 数据存储设计及开发——存储技术选型、存储业务流程解析、存储目录规划及文件命名规则、小文件合并实现

    4. 数据统计设计及开发——数据预处理、数据加载、原始数据表的创建、数据入库、数据ETL

    5. 报表统计设计——数据模型设计、事实表设计、维度表梳理

    6. 业务指标设计及开发——PV统计(时间维度、终端维度、地域维度)、来访次数统计(时间维度、地域维度、终端维度)、独立访客统计(时间维度、终端维度、地域维度)、受访页面统计(时间维度、栏目维度)、页面热点图、转化率分析、来源关键词分析、来源搜索引擎分析、来源广告推广分析

    2.3.4 任务调度系统设计实现

    任务调度单元实现、各环节任务运行频次及依赖关系梳理、工作流设计及实现、工作流定义配置上传部署、工作流启动即状态监控

    2.3.5 数据可视化——结果报表展现

    1. hive分析结果使用sqoop导出到msyql数据库

    2. 报表展现系统技术选型:

    后台使用spingmvc + spring + mybatis

    前端页面使用全静态异步刷新技术Jquery + Echarts

    3. web展现程序架构搭建,使用maven构建项目工程

    4. web展现程序页面设计开发:原型页面设计、js代码开发

    5. 最终实现以下数据可视化效果:

    (1)流量概况可视化效果:

    (2)来源地域分析可视化效果:

    (3)来源类型分析可视化效果:

    相关文章

      网友评论

        本文标题:大数据经典学习路线(及供参考)之 二

        本文链接:https://www.haomeiwen.com/subject/urukjftx.html