主要简介机器学习算法
1.懂原理
通过简单语言进行数学推导。
2.会用工具
用现成的包
3.掌握编程语言
4.会优化
根据自己的需求制定定制性的算法。
机器学习的几个基本概念
机器学习的性质
机器学习方法的三要素
经验风险与结构风险
目标:
了解
1.概念
2.实质
3.损失函数
4.经验风险与结构风险
机器学习的基本概念
机器学习方法流程
- 输入数据 raw data
- 特征工程 features
特征(属性、字段)。有些数据需要修整。 - 模型训练 models
- 模型部署 deploy in production
-
模型应用 prediction
机器学习方法流程.png
输入空间与输出空间
输入空间:输入的所有可能取值的集合。
输出空间:输出的所有可能取值的集合。
输入空间和输出空间可以是有限元素的集合,也可以是整个欧式空间。可以是连续值集合,也可以是离散值集合。可以是同一个空间,也可以是不同空间。
通常情况下,速出空间比输入空间小。
特征空间
特征:即属性。
特征向量:多个特征组成的集合。
特征空间:特征向量存在的空间称作特征空间。
特征可以从连续型转变成离散型。
- 特征空间中每一维都对应了一个特征
- 特征康健可以和输入空间相同,也可以不同。
- 需要将实例从输入空间映射到特征空间。
- 模型实际上是定义于特征空间之上的。
假设空间
输入空间到输出空间的映射的集合。
《统计学习方法》《机器学习》
针对每一种输入,都能找到一个映射,对应了输出空间中某个输出。
建模的过程就是,在假设空间中寻找一种和当前提供的数据匹配度最高的假设。
网友评论