数据挖掘概述
数据挖掘概念
随着爆炸性的数据增长,我们拥有丰富大量的数据,但却不足以提供有用的信息。我们亟需一些工具帮助我们从海量数据中提取有用的信息。
数据挖掘就是从数据中发现有用信息,从而帮助我们决策的数据工具。
以上关键词:数据、有价值的信息、帮助决策
- 数据:往往是大量的、不完全的、有噪声的、模糊的、随机的等等
- 价值信息:隐藏在数据中,人们事先不知道,但又有潜在价值的信息和知识
- 帮助决策:从技术角度帮助人们决策,需要用到统计学、机器学习、人工智能等科学的技术和知识。
数据挖掘目标
预测数据 | 描述数据 |
---|---|
监督学习 | 非监督学习 |
从标记的训练数据发现规律来推断预测 | 依据未标签化的训练样本进行模式识别 |
回归、分类 | 聚类、关联规则 |
详细划分
回归 | 分类 | 聚类 | 关联规则 |
---|---|---|---|
样本映射到一个真实预测值 | 样本划分到几个预定义类的一个 | 样本划分为无预定义类的不同类 | 发现数据集中不同特征的相关性 |
算法应用 | 算法应用 | 算法应用 | 算法应用 |
Lasso回归 | K-近邻 | K-mean聚类 | Apriori算法 |
弹性网络 | 逻辑回归 | 分层聚类 | ... |
支持向量回归 | 决策树 | ... | ... |
数据挖掘及其他名词
数据分析
数据分析是一个比较大的概念,应该包括:数据统计、OLAP、数据挖掘等等
人工智能
人工智能应该目前所有名词的汇总。强调用计算机来实现人类智能。应该包括:数据挖掘、机器学习、深度学习等等。
机器学习
机器学习显然属于人工智能的一个分支,但却是人工智能的核心,也是数据挖掘实际应用的理论基础。
深度学习
深度学习作为机器学习的一部分,强调人工神经网络的算法。
参考图片
小结
我们已经了解到数据挖掘及其相关知识,未来将围绕数据挖掘逐步介绍其算法应用,并且结合数据分析方法和可视化给予更生动的认识。
网友评论