什么是机器学习？

机器学习是人工智能 (AI) 的一种应用，它使系统能够自动学习和改进经验，而无需明确编程。

机器学习专注于开发可以访问数据并使用它自己学习的计算机程序。

路线图分为5 个步骤：

第 1 步：学习类型

监督学习

无监督学习

强化学习

1. 监督学习：

监督机器学习是向机器学习模型提供输入数据和正确输出数据的过程。

2. 无监督学习：

用于分析和聚类未标记数据集的无监督机器学习算法。

3. 强化学习：

强化机器学习是一种类似于监督学习的机器学习模型，但算法不是使用样本数据进行训练的。

第 2 步：实际应用

自动驾驶汽车

自动驾驶汽车，也称为自动驾驶汽车 (AV)、自动驾驶汽车、无人驾驶汽车或机器人汽车 (robo-car)，是一种结合了车辆自动化的汽车，即能够感知其环境并在很少或没有人为输入的情况下安全移动。

聊天机器人

聊天机器人是通过聊天中的文本消息模拟与用户进行类人对话的软件。它的主要任务是通过提供问题的答案来帮助用户

流失预测电影

这是一个预测模型，在单个客户的层面上估计他们必须离开的倾向（或易感性）

诊断等

诊断是对某种现象的性质和原因的识别。诊断用于许多不同的学科，在逻辑、分析和经验的使用上有所不同，以确定“因果关系”。

第 3 步：应用 ML 的过程

1. 数据清理/探索/准备

数据清洗是机器学习的重要组成部分之一。它在构建模型中起着重要作用。这肯定不是机器学习中最精彩的部分，同时也没有任何隐藏的技巧或秘密可以揭开

特征工程

特征工程是使用领域知识从原始数据中提取特征（特征、属性、属性）的过程。

异常值处理

异常值只不过是与其他观察结果显着不同的数据点。它们是位于数据集整体分布之外的点。异常值如果不加以处理，可能会导致统计分析出现严重问题。

缺失值处理

缺失值处理是数据预处理中最重要的步骤之一。它包括识别缺失值并以丢失最少信息的方式处理它们

2. 数据建模

数据建模是创建整个信息系统或其部分的可视化表示的过程，以传达数据点和结构之间的连接

3. 模型验证

模型验证被暗示为使用测试数据集评估训练模型的过程

4. 模型评估

模型评估是使用不同的评估指标来了解机器学习模型的性能及其优缺点的过程

5.模型部署

模型部署只是将 ML 模型公开给实际使用的工程任务。该术语通常与通过实时 API 提供模型同义。

第 4 步：练习

1. 加入社区

2. 向专家学习

3. 参加 Kaggle 比赛

4.收听播客

5. 订阅时事通讯

6. 学习工具和技术

Python

Python 是一种具有动态语义的解释型、面向对象的高级编程语言。

Keras

TensorFlow

Scikit-Learn

Pandas

NumPy

R

R 是一种用于统计分析、图形表示和报告的编程语言和软件环境

mlr

dplyr

caret

第 5 步：理论

1. 多元微积分

多元微积分在机器学习中非常重要，因为我们使用优化来改进我们的神经网络。特别是，我们使用梯度下降的变化来优化神经网络。

2.算法和复杂性

算法复杂度是在给定大小为 n 的输入的情况下，算法完成所需时间的度量。

3.优化

优化，也称为数学规划，是许多学科中用于解决定量问题的数学原理和方法的集合

4. 概率论与统计

概率论是数学和统计学的一个领域，涉及寻找与随机事件相关的概率。研究概率论有两种主要方法。这些是理论概率和实验概率。

5. 线性代数

线性代数是对线性组合的研究。它是对向量空间、线和平面以及执行线性变换所需的一些映射的研究。