这里只是记录课程的观点,都是吴恩达教授的授课内容的要点记录
第一课
概述:
- 现状
- 怎么部署环境
机器学习的应用 - 搜索
- 图片标记
- 垃圾邮件识别
课程内容 - 算法学习
- 算法和数学不好
- 运用知识解决问题
应用例子:
-
数据挖掘
- 来源:网络 (理解用户习惯),医疗记录(检查数据), 生物数据,工程信息
-
不能人工编程的应用
- 无人机
- 手写识别
- NLP 自然语言
- 计算机视觉
-
定制项目
- Netflix,Amazon,ITunes genius, 基于用户数据去学习用户习惯
-
认识人类思考和脑的运作
机器学习是什么
- 定义
- 发展历史:Arthur Samuel (1959),Tom Michel (1999)
- 机器学习类型:
- 监督学习
- 无监督学习
- 强化学习
- 推荐系统
监督学习
- 最常见的机器学习
- 例子:
预测房价
image.png当一个朋友有个 750 英尺平方房子,价格是多少呢?
直线: $150,000
曲线: $ 200,000
是什么意思呢?
我们给算法一个数据,期待返回一个正确的结果
现在我们知道一些房子的价格:
- 从训练数据中,我们去学习怎样房子大小和价格关系
- 训练后的算法应该能基于新的训练数据返回正确的价格
这也叫回归系统
- 例子2:
根据肿瘤大小区分良性或恶性, 这是一个分类问题。根据数据,区分类别,不存在同时符合两个类别的。
输入参数可以是多个,如年龄和大小
image.png根据数据,我们尝试去分类:
- 直线分开两类
- 更复杂的分类方法
- 根据这个方法,给出年龄和大小,可以区分到哪一组
无监督学习
给一些没有标签的数据,让你去自动建模分类
- 聚类算法
1.新闻分类
2.基因- 微阵列
- 社会关系分析
- 天文数据分析
没有标准答案,自己去寻找规律
- 鸡尾酒算法 (cocktail party algorithm)
太嘈太多人说话,怎么听清楚每个人的声音呢?
image.png1.发现一共有2个人声
2.区分他们
线性回归
继续使用房价例子,前面监督学习可以解决,
现在我们用无监督学习来处理:
- 训练模型参数,通过数据输入,系统输出和数据真实结果对比,调整模型参数,达到比较好的结果
2.使用这个训练后的模型(就是一个函数),房子大小为输入,价格为输出。
image.png线性回归 (价值函数-cost function)
-
根据训练 hθ(x),我们想拿到一个直线
1.如当xs 在 hθ(x)上取一个最接近结果的点
2.想办法让 hθ(x) - 函数更接近 -
正式化,最小化问题,归一化
Minimize (hθ(x) - y)2
例如:最小化 房价和预测房价的误差
- 1/m - 我们决定平均值
- 1/2m - 2 是让数学计算容易一点,不用改变常量。
从新说明:
假设: 这是我们的预测机器,
image.pngCost- 使用我们的训练数据,确定你的θ 是能使假设尽可能正确的代价
image.png这也称为平方误差代价函数, J(θ0,θ1)
代价函数决定参数值,参数决定了预测行为
简化一下 ,θ0 = 0
image.png根据函数,我们可以知道,越偏离正确值,函数值越高,就是代价越高。
image.png如果是两个参数
θ0 = 50
θ1 = 0.06
在图中,我们也找到y的最小值。
这是最简单的例子,现实中我们就是想要一个有效的函数去找θ0 和 θ1最小值
网友评论