数据科学理论基础
1.数据科学概念
2.数据科学预测预警分析
3.商业智能与数据科学
数据科学研究的重要角色
1.数据科学家
2.数据科学与工程相关角色
大数据生命周期管理方法论
1.数据分析模型概述
跨行业数据挖掘标准流程(CRISP-DM模型):
商业理解-数据理解-数据准备-建立模型-模型评估-结果发布
2.数据分析模型流程框架
3.数据分析模型创新案例
4.数据分析工具
SAS,SPSS,R语言工具,State,Matlab
数据仓库理论
1.数据仓库主要特征
面向主题、继承、时变、非易失
2.数据仓库建模
业务建模、领域建模、逻辑建模、物理建模
3.数据仓库设计
4.数据仓库建设方法论
5.数据仓库相关技术
ETL、OLAP
6.DW、OLAP与DM的关系
数据挖掘高级理论
1.聚类分析
k-means
2.关联分析
Apriori算法,FP-growth算法
3.回归和分类分析
线性回归、逻辑回归、多项式回归、逐步回归、朴素贝叶斯、决策树、随机森林
4.时序模型
AR模型、MA模型、ARMA模型、ARIMA模型
5.结构优化
启发式算法
6.深度机器学习
人工神经网络、支持向量机、马尔可夫聚类算法
大数据语义分析知识发现
1.大数据知识发现过程
数据集成-数据选择-数据整合-数据挖掘-大数据可视化
2.大数据知识发现技术框架
数据采集、数据整合与管理、存储技术、语义技术、计算技术、分析技术、数据挖掘、数据可视化、数据安全、运维管理工具
3.大数据知识发现专家系统
4.企业大数据知识管理框架
大数据分析处理平台
1.结构化大数据处理架构
数据集成、CDC工具、分析引擎、数据挖掘
2.非结构化大数据处理框架
EDH
3.主流大数据分析平台
Palantir,IBM Platform Symphony,清数NEO
网友评论