这片学习笔记来自于google一个课程《Machine Learning 101》,整个课程并没有很深入的讲机器学习的具体算法实现,而是从更宏观的视角介绍了什么是机器学习,它工作的基本原理是什么,它有哪些训练方式,它的输出类型又有哪些,还有这些常见应用在机器学习中的算法类型有什么?我对课程中的一些关键要点进行了记录,希望能够帮助好奇的读者能够从宏观视野来理解机器学习,也能够站在门口窥探一下机器学习的内部构造
什么是ML, ML有什么类型
- Artificial Intelligence现在主要领域是Narrow AI,在特定的领域做的比人类好(比如识别物体,声音,NLP,创意,预测,翻译,转换)
- Machine Learning是根据数据找出模式,通过教机器识别模式,而不是通过编程定义的特殊规则。
-
Deep Learning是一个实现machine learning的技术,deep neural network(DNN)是一种DL技术
image
如何选择数据来训练
- 第一步是确定被识别对象的属性,features/attributes,找出具有差异性的属性。注意太多维度数据会导致过度拟合,所以需要分别属性的分辨度
- 第二步是获取足够多的数据来进行训练,下面ML的7步
- 获取数据,Gathering Data
- 准备数据,Preparing that Data
- 选择模型,choosing a model
- 进行训练,Training
- 评估结果,Evaluation
- 参数调优,Parameter Tuning
- 进行预测,Prediction
下面这个视频是介绍上面七步的完整视频,
https://www.youtube.com/playlist?list=PLIivdWyY5sqJxnwJhe3etaK7utrBiPBQ2
下面这个网站可以掩饰机器学习是如何进行的
http://playground.tensorflow.org/
机器学习有哪些训练方式
- Supervised Learning,你需要告诉机器如何对数据分类,需要人来给出数据的标签
- Unsupervised Learning,机器可以自己对数据进行分类,从一个非标签化的数据集中学习
- Reinforcement Learning,在训练中加入奖励和惩罚,每次训练都是一次尝试
这些训练方式是如何工作的
- 使用回归模型来拟合离散点
- 使用一条线来划分两个群体
- 使用k-nearest neighbour来区分
- 神经网络,模拟大脑建模。
-
每个神经节点有加权的输入信息
image -
很多神经节点构成了多层神经网络
image
-
下面这个视频可以帮助更形象的理解Deep Neural Network
https://www.youtube.com/watch?v=aircAruvnKk
ML的输出类型
-
回归:预测数值
image -
分类:对象分类
image -
集群:相似的放在一起
-
序列预测:预测一句话的下一个词
-
概率估计
ML的算法类型
1.Regression
找出最贴近离散点的回归函数
image
2.Instance-Based
根据离散点的距离来分类
image
网友评论