美文网首页
First Try:机器学习应用及其理论分类

First Try:机器学习应用及其理论分类

作者: 贝_0f41 | 来源:发表于2018-12-31 23:20 被阅读0次

    前段时间花69元购买了“吴恩达《机器学习》作业班”的资料,昨天刚开课,开课第一节的“开营仪式”的语音直播中首先强调了要整理笔记,要输出,否则时间久了就忘记了,这是一个整理学习的过程,所以我就来到了这里,希望自己也能慢慢养成这样一个习惯,在不断的总结中进步。

    s2机器学习绪论

    p1.机器学习中比较活跃的四大应用领域

    ️数据挖掘:发掘数据之间的关系

    ️计算机视觉:像人一样看懂世界

    ️自然语言处理:像人一样看懂文字

    ️机器决策:像人一样决策

    p2.案例1:血糖值的预测

    回归问题

    已知:如表格中,共5643个样本,每个样本是一个人的体检的信息。

    求:一个数学函数f,使其f(一个人的性别,年龄,总蛋白……淋巴细胞)=一个人的血糖值

    这是一个回归问题,因为血糖值是连续的小数

    p3.案例2:有无糖尿病的预测

    分类问题

    已知:如表格所示,共1000个样本,每个样本是人的体检检查的信息

    求:一个数学函数f ,使其f(snp1,身高,bmi分类……snpss)=一个人是否患有糖尿病

    分类问题:输出是离散值,代表属于哪类问题

    p4.机器学习相关问题

    机器学习两大基本问题:

    ️回归问题

    ️分类问题

    什么是机器学习?

    根据已知的数据,学习出一个数学函数f(x1,x2,x3,……xn)=y,使其能够有更强的预测能力

    一些专有名词的概念:

    ️①机器学习模型:f

    ②features

    ️③label

    ️④样本

    ️⑤数据集

    p5.计算机视觉的案例

    案例3:图像分类

    已知:如图所示,为一些示例样本

    求:一个机器学习模型f,使其

    原始图像  输入  机器学习模型  输出  类别

    最近比较火的微信小程序:猜画小歌(刚刚体验了,真的很不错)

    样本通常为上万个样本

    p6:目标检测

    已知:如图所示,为2个示例样本

    求:一个机器学习模型f,使其  原始图像    输入    机器学习模型    输出  label

    比较典型的应用:无人驾驶

    让机器能够检测出一张图片中的所有物体,并能够判断出每个物体所属哪个类别,并且能够计算出物体在图片中的坐标信息

    如图中,无人车的目标检测,无人车检测出图片中所有车辆,用红色框出所有小汽车,用蓝色框出所有大卡车

    label 更为复杂,(20,60,50,80,4),前四个为坐标信息,最后一个为类别信息

    数据集是人工一张一张的标注的,是庞大的工作,由庞大的机构进行后公开,供全球学者使用

    p7:语音分割

    已知:如图为3个示例样本

    本质上来讲仍然是分类问题,即对每个像素点进行分类f([x_{i},y_{i}  ])=y   ([x_{i},y_{i}  ]表示第i个像素点)

    求:一个机器学习模型f,使其    原始图像    输入    机器学习模型    输出    label

    目标检测用检测框框出来的物体,不仅包括自身信息,还物体周围的信息也被标注在检测框内

    语义分割更为精确,仅仅分割出自身的信息

    如图中,马吃草经过语音分割后变成右侧,不包含周围信息

    数据集依旧是人工标注的

    p8:场景理解

    左边为原始图片,右侧为切割好的图片

    无人车可以根据显示的信息对图片进行分割,紫色的为汽车,粉色的物体表示道路,红色表示高楼,无人车可以根据此规划出可行的区域来

    自然语音处理案例

    p9:案例7 文本分类(例如新闻分类,体育?政治?科技……)

    一篇新闻    输入    机器学习模型    输出    类别

    案例8: 自动生产文本摘要

    一篇文章    输入    机器学习模型    输出    摘要

    案例9:翻译

    一句英文    输入    机器学习模型    输出    一句中文

    p10: 案例10:问答

    已知:如图所示,为一个实例样本

    求出:一个机器学习模型,使其

    p11:微软小冰

    一句话    输入    机器学习模型    输出    一句话 

    如机器人聊天客服,微软小冰公众号

    p12: image to text

    已知:如下图所示,共4个实例样本

    求出:一个机器学习模型f,使其

    image    输入    机器学习模型    输出    text

    根据图形自动输出一段描述图形的文本,文字与图片相一致,需大量人工标注

    p13机器人决策案例

    案例13:end to end 级自动驾驶

    已知:如图所示,为2个示例样本

    求:一个机器学习模型f,使其    相机    一张图片    机器学习模型    控制信号    车辆

    传统的无人驾驶:相机和雷达采集车周围的信息,然后计算机对其进行三维建模等 ,然后根据建好的模型进行路径规划,最终产生控制信号控制车辆,总共有3个步骤:感知环境——路径规划——控制信号

    而end to end 控制(端到端无人驾驶):没有传统的环境感知和路径规划的步骤

    图为nvdia2016年的研究

    进过大量的人力物力搜集样本,根据机器学习的算法输出模型

    p15:案例14:玩赛车游戏

    已知:如图所示,为torcs平台,一个赛车游戏(选手不是真实玩家,而是机器人(计算机程序)),也是一个无人驾驶的仿真环境,可以模拟一些实际场景,可以对车辆进行控制,比如向上换挡/向下换挡/加速/减速/向左打方向盘/向右打方向盘等,使其完成一次动作,比如车辆跟随,换道,超车,沿道路行驶等

    世界各国的人们都会尝试开发一个程序去玩这个游戏

    求出:一个机器学习模型f(通常将其称为agent),使agent像人一样,具有决策能力,能够控制这个赛车取得游戏中的最好成绩

    agent 玩赛车的过程:

    dota2 机器人挑战职业玩家

    p16:案例15:机器人开门

    已知:如图所示,为一个机器人开门的模拟环境和一个真实环境

    求出:一个机器学习模型f(通常称为agent),使机器人能够根据摄像头采集到的信息,输出控制指令,对手臂进行控制,进而完成开门这一任务

    agent开门的过程:

    在仿真环境中进行大量学习训练得出基础模型,然后从真实环境中进行少量训练,对基础模型微微调整,以使其能够更好的从仿真环境迁移到真实环境中

    p17:机器学习理论分类

    根据上述案例所用到的知识理论,将机器学习理论主要分为以下3大部分:

    注:上述3大理论只是机器学习中最为常用最为活跃的部分,当然严格意义上来讲,机器学习还包括其他方面的理论,只是不常用

    每个应用案例用到了哪些相关理论知识:

    传统的监督学习/深度学习:案例1血糖值预测和案例2有无糖尿病预测

    深度学习:自然语音处理所有案例,计算机视觉所有案例和案例13end to end级无人驾驶

    深度学习+强化学习:案例14玩赛车游戏,案例15机器人开门

    注:在自然语言处理领域/计算机视觉领域,过去常常用传统的监督学习算法,但现在在很多任务上深度学习的效果更好,但是也有一部分任务上传统的监督学习算法更好。

    p18 总结

    建议路线:传统的监督算法——深度学习——强化学习

    建议准则:循序渐进,慢慢来,一开始不要试图看懂一本书或一套视频的所有知识点

    总的来说:这篇文章是边听视频边抄下来的,虽然不是自己编写的内容,可是还是成就感满满,毕竟对我一个还没有入门的小白来说,一开始就是要认真记录,消化吸收,时间久了自然能够输出自己整理的内容,加油!

    相关文章

      网友评论

          本文标题:First Try:机器学习应用及其理论分类

          本文链接:https://www.haomeiwen.com/subject/fvowlqtx.html