前段时间花69元购买了“吴恩达《机器学习》作业班”的资料,昨天刚开课,开课第一节的“开营仪式”的语音直播中首先强调了要整理笔记,要输出,否则时间久了就忘记了,这是一个整理学习的过程,所以我就来到了这里,希望自己也能慢慢养成这样一个习惯,在不断的总结中进步。
s2机器学习绪论
p1.机器学习中比较活跃的四大应用领域
️数据挖掘:发掘数据之间的关系
️计算机视觉:像人一样看懂世界
️自然语言处理:像人一样看懂文字
️机器决策:像人一样决策
p2.案例1:血糖值的预测
回归问题已知:如表格中,共5643个样本,每个样本是一个人的体检的信息。
求:一个数学函数f,使其f(一个人的性别,年龄,总蛋白……淋巴细胞)=一个人的血糖值
这是一个回归问题,因为血糖值是连续的小数
p3.案例2:有无糖尿病的预测
分类问题已知:如表格所示,共1000个样本,每个样本是人的体检检查的信息
求:一个数学函数f ,使其f(snp1,身高,bmi分类……snpss)=一个人是否患有糖尿病
分类问题:输出是离散值,代表属于哪类问题
p4.机器学习相关问题
机器学习两大基本问题:
️回归问题
️分类问题
什么是机器学习?
根据已知的数据,学习出一个数学函数f(x1,x2,x3,……xn)=y,使其能够有更强的预测能力
一些专有名词的概念:
️①机器学习模型:f
②features
️③label
️④样本
️⑤数据集
p5.计算机视觉的案例
案例3:图像分类
已知:如图所示,为一些示例样本
求:一个机器学习模型f,使其
原始图像 输入 机器学习模型 输出 类别
最近比较火的微信小程序:猜画小歌(刚刚体验了,真的很不错)
样本通常为上万个样本
p6:目标检测
已知:如图所示,为2个示例样本
求:一个机器学习模型f,使其 原始图像 输入 机器学习模型 输出 label
比较典型的应用:无人驾驶
让机器能够检测出一张图片中的所有物体,并能够判断出每个物体所属哪个类别,并且能够计算出物体在图片中的坐标信息
如图中,无人车的目标检测,无人车检测出图片中所有车辆,用红色框出所有小汽车,用蓝色框出所有大卡车
label 更为复杂,(20,60,50,80,4),前四个为坐标信息,最后一个为类别信息
数据集是人工一张一张的标注的,是庞大的工作,由庞大的机构进行后公开,供全球学者使用
p7:语音分割
已知:如图为3个示例样本
本质上来讲仍然是分类问题,即对每个像素点进行分类
求:一个机器学习模型f,使其 原始图像 输入 机器学习模型 输出 label
目标检测用检测框框出来的物体,不仅包括自身信息,还物体周围的信息也被标注在检测框内
语义分割更为精确,仅仅分割出自身的信息
如图中,马吃草经过语音分割后变成右侧,不包含周围信息
数据集依旧是人工标注的
p8:场景理解
左边为原始图片,右侧为切割好的图片
无人车可以根据显示的信息对图片进行分割,紫色的为汽车,粉色的物体表示道路,红色表示高楼,无人车可以根据此规划出可行的区域来
自然语音处理案例
p9:案例7 文本分类(例如新闻分类,体育?政治?科技……)
一篇新闻 输入 机器学习模型 输出 类别
案例8: 自动生产文本摘要
一篇文章 输入 机器学习模型 输出 摘要
案例9:翻译
一句英文 输入 机器学习模型 输出 一句中文
p10: 案例10:问答
已知:如图所示,为一个实例样本
求出:一个机器学习模型,使其
p11:微软小冰
一句话 输入 机器学习模型 输出 一句话
如机器人聊天客服,微软小冰公众号
p12: image to text
已知:如下图所示,共4个实例样本
求出:一个机器学习模型f,使其
image 输入 机器学习模型 输出 text
根据图形自动输出一段描述图形的文本,文字与图片相一致,需大量人工标注
p13机器人决策案例
案例13:end to end 级自动驾驶
已知:如图所示,为2个示例样本
求:一个机器学习模型f,使其 相机 一张图片 机器学习模型 控制信号 车辆
传统的无人驾驶:相机和雷达采集车周围的信息,然后计算机对其进行三维建模等 ,然后根据建好的模型进行路径规划,最终产生控制信号控制车辆,总共有3个步骤:感知环境——路径规划——控制信号
而end to end 控制(端到端无人驾驶):没有传统的环境感知和路径规划的步骤
图为nvdia2016年的研究
进过大量的人力物力搜集样本,根据机器学习的算法输出模型
p15:案例14:玩赛车游戏
已知:如图所示,为torcs平台,一个赛车游戏(选手不是真实玩家,而是机器人(计算机程序)),也是一个无人驾驶的仿真环境,可以模拟一些实际场景,可以对车辆进行控制,比如向上换挡/向下换挡/加速/减速/向左打方向盘/向右打方向盘等,使其完成一次动作,比如车辆跟随,换道,超车,沿道路行驶等
世界各国的人们都会尝试开发一个程序去玩这个游戏
求出:一个机器学习模型f(通常将其称为agent),使agent像人一样,具有决策能力,能够控制这个赛车取得游戏中的最好成绩
agent 玩赛车的过程:
dota2 机器人挑战职业玩家
p16:案例15:机器人开门
已知:如图所示,为一个机器人开门的模拟环境和一个真实环境
求出:一个机器学习模型f(通常称为agent),使机器人能够根据摄像头采集到的信息,输出控制指令,对手臂进行控制,进而完成开门这一任务
agent开门的过程:
在仿真环境中进行大量学习训练得出基础模型,然后从真实环境中进行少量训练,对基础模型微微调整,以使其能够更好的从仿真环境迁移到真实环境中
p17:机器学习理论分类
根据上述案例所用到的知识理论,将机器学习理论主要分为以下3大部分:
注:上述3大理论只是机器学习中最为常用最为活跃的部分,当然严格意义上来讲,机器学习还包括其他方面的理论,只是不常用
每个应用案例用到了哪些相关理论知识:
传统的监督学习/深度学习:案例1血糖值预测和案例2有无糖尿病预测
深度学习:自然语音处理所有案例,计算机视觉所有案例和案例13end to end级无人驾驶
深度学习+强化学习:案例14玩赛车游戏,案例15机器人开门
注:在自然语言处理领域/计算机视觉领域,过去常常用传统的监督学习算法,但现在在很多任务上深度学习的效果更好,但是也有一部分任务上传统的监督学习算法更好。
p18 总结
建议路线:传统的监督算法——深度学习——强化学习
建议准则:循序渐进,慢慢来,一开始不要试图看懂一本书或一套视频的所有知识点
总的来说:这篇文章是边听视频边抄下来的,虽然不是自己编写的内容,可是还是成就感满满,毕竟对我一个还没有入门的小白来说,一开始就是要认真记录,消化吸收,时间久了自然能够输出自己整理的内容,加油!
网友评论