MLA CH1 Machine Learning Basics

作者: Mandy今天也沉迷学习 | 来源:发表于2020-03-06 17:50 被阅读0次

1.2 术语

  • 专家系统(expert system)
  • 特征(features)
  • 分类(classifications)
  • 训练集(training set)
  • 目标变量(target variable):所要通过ML预测的
  • 类(classes):在分类问题中的Target Variables就是classes
  • 测试集(test set):与训练集分隔开,用于测试算法,其中测试集并没有将自己的目标变量告知程序,由程序决定其中的每个例子从属于哪一个类,从而可以验证算法的准确性
  • 知识表示(knowledge representation):可能表现为一系列规则/概率分布/训练集中的例子

1.3 ML的关键任务

1. 监督学习(supervised learning)

监督:我们已经告诉了算法我们希望预测的是什么

  • 分类(classification)
  • 回归(regression):预测数值

2. 无监督学习(unsupervised learning)

无监督:不存在标签&目标值

  • 聚类(clustering)
  • 核密度估计(density estimation)
  • 减小维度


    algorithms for ML

1.4 如何选择合适的算法?

  • 预测一个目标值——>监督学习 / 否则无监督学习
  • 若目标值为离散值,如A/B/C——>分类
  • 若目标值为数值——>回归

  • 预测目标值,且要求无监督学习,且希望数据分为离散的组——>聚类
  • 若希望得到拟合强度的数值表示——>核密度估计算法

  • 最优算法最优结果不唯一

1.5 ML应用步骤

  1. 收集数据
  2. 准备输入的数据:useful format
  3. 分析输入的数据
  4. 清洗
  5. 训练算法:with good clean data,对于无监督学习而言 没有这一步
  6. 测试算法:监督学习中使用已知值来进行测试;无监督学习实行别的方法。如果不满意则返回step 4,再重新尝试;必要的话返回step 1。
  7. 使用:若有问题,重返step 1-5。

1.6 Why Python?

  • executable pseudo-code
  • popular, modules available
  • high-level language
  • drawbacks: not fast as Java & C
  • use numpy heavily in this book
  • start with Numpy library:
from numpy import *
random.rand(n,m) # creat random array of size nxm 
mat() # convert array to a matrix
randMat = mat(random.rand(n,m))
InvRandMat=randMat.I  # the inverse of the matrix
eye(t)  # create an identity matix of size t
...

相关文章

网友评论

    本文标题:MLA CH1 Machine Learning Basics

    本文链接:https://www.haomeiwen.com/subject/uxrwrhtx.html