可以认为大数据、数据挖掘和机器学习是三个平行的概念。大数据侧重描述数据,数据挖掘侧重描述应用,机器学习侧重描述方法。当然,数据是基础,是挖掘和学习的“燃料”(Ng说深度学习像火箭,计算是引擎,数据是燃料)。
大数据的内涵,是从数据量、数据类型和数据增长速度的角度描述数据。由于这些特点,数据的存储、传输、计算、处理、分析等,都是传统方式难以应对的,相关的技术就要升级,新的技术栈通常基于分布式架构解决,而分布式架构又带来一致性、资源调度、性能优化等多种问题,由此批处理、流计算、图计算、即席查询等方向都有发展。
数据挖掘是指从大量数据中挖掘出有价值的潜藏规律和知识。数据挖掘渴望完整而真实的原始数据,去噪和样本平衡很重要。实施过程涉及机器学习、模式识别、统计学、分布式存储、分布式计算、可视化等,还需要掌握领域专业知识。
机器学习是从数据中获取经验进而改善系统性能的一类重要方法,“学习”的意义就是求解最逼近真相的经验,理论基础主要是统计学。数据挖掘经常需要采用机器学习方法,但目前机器学习主要是想实现某种程度的人工智能。
编辑于 2017-09-08
转自知乎
数据挖掘、机器学习、深度学习这些概念有区别吗?
添加一个了解的角度:数据挖掘概念火爆的时候,数据仓库正当家。机器学习是随着大数据概念为人熟知的。深度学习是神经网络算法的新近发展,是随着机器学习概念被广知的。 数据挖掘作为一众数据分析技术的统称,出现较早。彼时有余数据库处理能力局限等原因,强调从抽样数据出发分析数据全集。 机器学习严格来说与数据挖掘不是对等概念,仍属于数据挖掘范畴。只不过更多地基于大数据理念出发,直接在数据全集中进行分析,故而有“…
网友评论