机器学习是指让机器主动学习知识,这个理解是对比与二十世纪五十年代人工智能处于推理期的阶段,人们试图通过人来对计算机灌输一些知识理论。而机器学习则是让机器自己来总结概念,知识。
机器学习研究的主要内容是“学习算法”,所谓学习算法就是通过数据来获得模型(解决方案)的算法。
机器学习过程划分为“机械学习”,“示教学习”,“类比学习”,“归纳学习”。现在的机器学习技术就是广义的归纳学习,即从样例中学习。包括了“监督学习”与“无监督学习”。
监督学习是指在训练集中是否提供了标记信息,典型的是分类(预测离散)和回归(预测连续)。
无监督学习则是指在训练集中无标记信息(有些包含),典型的是聚类任务(通过算法程序自动形成簇即分类组),聚类任务更加有助于了解数据内在的规律。
数据科学的核心就是通过分析数据来获得价值,而谈到分析数据则就需要机器学习来提供技术支持。因为机器学习研究的核心也就是通过数据来获得问题的解决方案的算法。
机器学习与数据挖掘的联系:数据挖掘是涉及数据库技术、机器学习技术与统计学技术的一门综合性领域,而统计学的成果往往需要通过机器学习来有效应用表达,因此数据库技术为大数据提供数据管理,而机器学习则为大数据提供分析计算。因此,数据库技术和机器学习是大数据领域的两大支撑。
奥卡姆剃刀原则主张选择与经验观察一致的最简单假设。
古希腊哲学家伊壁鸠鲁的多释原则,主张包留与经验观察一致的所有假设。
继续加油,不断学习!
网友评论