美文网首页
笔记1:Introduction of Machine Lear

笔记1:Introduction of Machine Lear

作者: 有魔法的迷雾森林 | 来源:发表于2019-07-17 22:05 被阅读0次

    Hung-yi Lee

    1.前言

    1.1 发展过程

    人工智能(目标)1950s    机器学习(方法)1980s    深度学习(机器学习的重要方法)2010s

    1.2生物的本能

    类比于程序的if/else(由人类设计好的程序的本能   hand-crafted roles)

    weakness of hand-crafted roles:

    (1)hard to consider all possibilities

    (2)lots of human efforts(not suit for small indstruy)

    1.3What is Machine Learning

    ~Looking for a Function From Data

    举例:

    (1)speech recognition(语音识别)

    (2)imagine recognition

    ...

    其工作的步骤是:第一步定义模型,第二步定义目标函数并训练,第三步选出最优模型:

    其中,第三步选择出最优的模型则根据goodness of fit(拟合优度)选择出更好的model。

    goodness of fit(拟合优度):模型(modle or function set)和训练数据(training data)的拟合度。

    2.Learning Map

    每一种Learning,都包含如上的三个问题(回归问题、分类问题、结构化问题),而这三种问题,都可以用线性模型或者非线性模型来解决。

    几种Learning的选择,在于所拥有的training Data的特点,从而选择不同的Learning,即根据不同的scenario,进行选择。

    task是指我们在不同的scenario下,所选用的Model的输出。在Regression中,其function的输出是一个scalar,在Classification中,其function的输出是某一个class(分类),在Structed Learning中,我们要得到的是一个无法穷举的output的一个子集。

    method即function set或称Model,在图中的意思是:在regression或者classification或者structed learning中,均可以有linear Model或者Non-linear Model。

    2.1Regression(回归问题)

    The output of the target function f is "scalar" (数值)。如pm2.5的预测,输出一个预测值表示pm2.5,而输出这样的“scalar”需要Training Data。

    2.2Classification(分类问题)

    需要根据拟合优度选取Model进行classification,包括Linear Model和Non-Linear Modle(如Deep Learning等),与liner model相比可以处理更加复杂的事情,如图像处理、围棋等。分为以下两类:

    (1)Binary Classification(二元分类),如:垃圾邮件的辨别,输入邮件获得是或者否。

    (2)Multi-class Classification,如:新闻的分类,输入一篇新闻,获得这篇新闻的分类。

    2.3Structured Learning(结构化问题)

    -“Beyond Classification”(处理非分类问题)

    如语音识别,输入声音信号,output出文字语句,我们无法穷举所有的语句。

    3.Scenario

    几种Learning的选择,在于所拥有的training Data的特点,从而选择不同的Learning,即根据不同的scenario,进行选择。

    3.1Supervised Learning:

    Supervised Learning需要的Training Data:input/output pair of target function(输入和function的output也叫做label)

    3.2Semi-supervised Learning:

    Semi-supervised Learning需要的Training Data:没有output的data

    3.3Transfer Learning:

    Transfer Learning需要的Training Data:有一部分有label,一部分没有label。

    3.4Unsupervised Learning:

    3.5Reinforcement Learning

    Supervised Learning:含有input和output的training data,可以理解为“Learning from teacher”

    Reinforcement Learning:机器没有input和output的function,会在机器输出之后最后得到一个“评价”,并根据评价去尝试修正。“Learning from critics”,更接近人类学习的过程。

    Alpha Go is supervised learning + reinfocement learning,先输入棋谱,后机器间进行博弈,没一句博弈都会得到一个评价,然后机器根据评价进行调整。

    相关文章

      网友评论

          本文标题:笔记1:Introduction of Machine Lear

          本文链接:https://www.haomeiwen.com/subject/qqaclctx.html