从0开始搭建产品经理AI知识框架：机器学习2方法篇

作者: 蓝风GO | 来源:发表于2017-11-02 08:10 被阅读1059次

上篇内容介绍关于机器学习一些基础概念的理解，今天深入的介绍机器学习的各种方式，以及在产品中的有哪些应用。

机器学习都有哪些学习方式？

涉及到机器学习相关知识：

监督学习：需要“标签”当老师，明确要预测什么。
无监督学习：不告诉机器正确答案，让机器自己学习，给出结果。
半监督学习：训练的数据，只有一小部分是标记过的，大部分是没有标记。
强化学习：通过反馈，边实践边学习。
迁移学习：在某个垂直领域训练完成后，移致去其他相关领域调优发挥作用。

监督学习

什么是监督学习：

概念：监督学习就是通过样例给定输入与输出，让程序学会一些通用的规则，这样对于需要预测的数据，得到输出。
诠释：有一个明确预测的目标，比如：预估房价，给予机器大量的有标签的数据，以及最终的销售价，来训练这个模型。

监督学习主要解决的是两类问题：

回归问题：
- 概念：预测结果是连续的，意味着我们尝试将输入变量映射到一些连续函数。
- 举例：如预测房价的例子，通过大量输入输出数据，以及各种房屋类型，环境等标签，训练模型后，输入新的数据，既可预测房价。
分类问题：
- 概念：预测结果是离散的，意味着我们尝试将输入变量映射到离散类别。
- 举例：如芒果的例子，同样通过大量输入输出数据，包括芒果，颜色，大小，形状，以及甜度，成熟度等标签，当输入新的数据，机器计算出属于这个芒果是在吃，还是在不好吃的分类里。

监督学习主要涉及到的算法模型如下：

线性回归模型（Linear Regression）
K-近邻算法（k-Nearest Neighbors，KNN）
决策树（Decision Trees）
朴素贝叶斯（Naive Bayesian）
逻辑回归（Logistic Regression）

个人建议产品经理对于算法重视，初期知道解决的是什么问题即可，不要从学习的视角去深入，而是实际遇到问题，遇到问题时候再研究。

无监督学习

什么是无监督学习：

诠释：无监督学习就是不给数据提供标签，由程序自动对数据进行聚类、关联、降维等工作。
诠释：我们拥有大量的数据，但是不知道答案，需要用无监督学习的方法，让它们根据某些特征自动分成若干组，从而找到数据中存在的价值。

无监督学习主要解决的三类问题：

关联
- 概念：为了发现各种现象同时出现的概率。
- 举例：经典例子，男人买啤酒和买尿布的关联性非常高，超市把啤酒和尿布放在一起，从而提高业绩。
聚类
- 概念：把样本分堆，使同一堆中的样本之间很相似，而不同堆之间的样本就有些差别。
- 举例：Google新闻，每天会搜集大量的新闻，然后把它们全部聚类，就会自动分成几十个不同的组（比如娱乐，科技，政治......），每个组内新闻都具有相似的内容结构。
降维
- 概念：降维意味着减少数据集中变量的个数，但是仍然保留重要的信息。主要作用是压缩数据与提升机器学习其他算法的效率。
- 举例：房价包含房子的长、宽、面积与房间数量四个特征，也就是维度为4维的数据。而面积=长 × 宽，通过降维算法我们就可以去除冗余信息，即从4维的数据压缩到2维

无监督学习主要涉及到的算法模型如下：

K 均值算法（K-means）
自编码（Autoencoding）
主成分分析（Principal components analysis）
随机森林（Random forests）

同理，解决实际问题中，再深入到算法里提升自己的认知。

半监督学习

什么是半监督学习：

概念：使用大量的未标记数据，以及同时使用标记数据，来进行模式识别工作。
诠释：大概意思就是，监督学习与无监督学习相结合的一种学习方法，介于两者之间。

半监督学习解决问题：

相比监督学习：节约人力成本，提高投入产出比。
相比无监督学习：可以得到分配更高精度的模型。

具体适用场景的举例：

例如：视频网站上有几百万的视频，但其中只有几十万的视频有标签，如果把剩下几百万视频都打上标签，工作量和成本是巨大的，而用无监督的方法，在很多情况下精度会很低，所以使用半监督的方法，可以在节省人力的情况下，得到分类更高精度的模型。
例如：垃圾信息过滤，一般的方法是监督，需要大量的语料标注，告知系统哪些可能是垃圾信息。但用户产会生了大量的信息，且垃圾信息的发布者也在调整策略，无法进行实时标注，这里可以用半监督的方法，根据垃圾信息发布者的特殊行为，发布内容等找到相似性，进行过滤。

强化学习

什么是强化学习：

概念：强化学习就是智能系统从环境到行为映射的学习，以使奖励信号(强化信号)函数值最大。如果Agent的某个行为策略导致环境正的奖赏(强化信号)，那么Agent以后产生这个行为策略的趋势便会加强。
诠释：针对没有标注数据集的情况而言，通过反馈来区分是否越来越接近目标。比如常见一个猜价格的游戏，你来猜这个东西值多少钱，别人告诉你猜的价格是高了还是低了。
例如：阿尔法狗，自己跟自己下围棋，通过一盘盘的胜负，自我学习、自我修炼、自我改正，然后一个一个迭代，自己跟自己下了1000万盘之后，完全就是一个新的狗狗。

强化学习和监督学习的区别：

监督学习总的来说是一个开环的学习。
- 通常，监督学习任务会从环境中收集一批数据；
- 接着我们用监督学习算法从数据中产生模型；
- 最后就可以用这个模型来做预测了。
但是对于强化学习来说，它面对的是一个闭环的学习。
- 首先，也是从环境中产生数据；
- 用强化学习的算法从数据中产生模型；
- 还要把模型放回到环境中运行，接着又会产生新的数据出来，再重复以上步骤。

强化学习的应用：

例如：训练机器臂，把一个指的位置的物体，拿到另外一个指定的位置上，这里你不告诉它怎么做，让他通过一遍遍的训练，找到最佳的移动物体路径。
例如：个性化推荐，当推荐你某个分类内容时候，你会点击或查看，它就会根据你的行为，推荐给你更多该分类的内容。
例如：无人机操作，指定你的无人机进行某种动作飞行，通过强化学习来控制高度，速度，姿态等等，根据奖励让它自己学习策略，来达到目的

迁移学习

什么是迁移学习：

概念：一般就是指要将从源领域学习到的东西应用到目标领域上去。
诠释：比如你会骑自行车，你会控制车把，刹车，控诉，躲避，踩踏，平衡感等等，然后让你骑摩托车时候，你也可以轻易上手，逐渐适应速度和动力上的特殊性。

迁移学习应用：

模拟中学习：不管是无人车，还是机械臂，在现实中学习耗时且昂贵。通过模拟的方法，在虚拟中完成部分的训练，迁移到现实中，当然这种方法存在很多问题，毕竟虚拟世界无法做到跟现实一模一样，比如物理引擎，但是作为初始训练是可行的。
适应新领域：在线推荐系统中利用迁移学习，例如影像资料领域做好一个推荐系统，然后应用在稀疏的、新的垂直领域书籍资料里。
跨语言传播知识：从一种语言学习然后将所得知识应用于另一种语言，是迁移学习的另一个重要应用。比如英语训练之后，迁移到印度本土语言上。

以上就是本人对于机器学习中各种学习方式理解，而其中的「深度学习」部分会单独谈谈自己理解。

AI PM认知系列的相关阅读：
第一篇：从0开始搭建产品经理的AI认知体系
第二篇：产品经理的AI知识框架：计算机视觉
第三篇：产品经理的AI知识框架：语音识别与合成
第四篇：产品经理的AI知识框架：机器学习1基础篇

作者：兰枫，前腾讯游戏，新浪微博PM，Elex产品总监，连续创业者。

网友评论

开发者头条_程序员必装的App:感谢分享！已推荐到《开发者头条》：https://toutiao.io/posts/43fxc7 欢迎点赞支持！
欢迎订阅《你未涉及的IT面》https://toutiao.io/subjects/216854
黄leo:老师，我想知道如果搭建一个智能客服平台，作为目前产品经理的我，我需要为这个平台设计哪些架构上模块呢，哪些是必须应该要有的，是各种人工生物识别技术+问答引擎+知识库+机器学习？是否有更深层次的理解所需要的设计模块？
黄leo:@蓝风GO 谢谢，自然语言理解因为也听了很多家的产品介绍，感觉不到这块他们有提到会成为瓶颈，更好像每家产品都宣称自己有多少的数据和算法模型在表达自身在意图识别和对用户问题理解有多准的领域上会着墨更多，所以您这边对于前端自然语言理解会是觉得目前的算法还不足以理解用户需求呢？还是会认为其背后的深度学习还不够深入呢？谢谢还望指教
蓝风GO:@黄leo AI在很多领域还是概念，并不是全都能落地，可以去参考一下微软小冰和百度度秘。
蓝风GO:@黄leo 智能客服会涉及到技术：自然语言理解+机器学习+垂直行业理解，而具体怎么去要根据具体需求和目标，要解决什么问题，解决的度是多少。目前自然语言理解还是AI的瓶颈，但垂直领域是有应用价值的，需要具象一点探讨。

从0开始搭建产品经理AI知识框架：机器学习2方法篇

机器学习都有哪些学习方式？

监督学习

无监督学习

半监督学习

强化学习

迁移学习

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

解码未来产品经理

@IT·互联网

@产品

@产品首页推荐

首页投稿（暂停使用，暂停投稿）

AI-CV类