1 什么是机器学习
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.(Tom Mitchell,1998)
一句话概括:计算机通过观察数据从而获取技巧的过程。
2 机器学习算法
2.1 监督学习
数据集中的每个样本都有相应的 “标签”。相当于我们知道输入对应的正确输出。
监督学习有两类问题:
- 分类问题:其目标是预测出一组离散的结果。例如预测病人是否患癌症(0:否, 1:是)
- 回归问题:其目标是预测出一组连续的结果。例如给定房子的面积信息,预测出房价。
2.2 无监督学习
给定的数据没有任何标签,或者都是相同的标签。无监督的学习中,我们很少或根本不知道我们的结果应该是什么样的。我们可以通过聚类,推出数据中变量之间的联系。
比如聚类问题:新闻主题分类,社交网络分析(朋友分组),市场分类(对顾客进行市场细分)
网友评论