序列最小最优算法(SMO算法)

作者: shenghaishxt | 来源:发表于2019-03-10 21:52 被阅读0次

机器学习之SMO算法
启发式算法
序列最小最优算法(SMO算法)
SVM（支持向量机）笔记-SMO算法、核函数，代码实现
12 SVM - SMO - 初始β变量的选择、总结
统计机器学习-序列最小最优化算法（SMO）
序列最小优化算法（SMO）浅析
11 SVM - SMO - 序列最小优化算法
SMO算法
SVM算法（支持向量机）

本文来自我的个人博客 https://www.zhangshenghai.com/posts/3981/

序列最小最优化算法(sequential minimal optimization, SMO)算法：1998年由Platt提出。支持向量机的学习问题可以形式化为求解凸二次规划问题，这样的凸二次规划问题具有全局最优解，并且有许多最优化算法可以用于这一问题的求解。但是当训练样本容量很大时，这些算法往往变得非常低效，以致无法使用。所以，如何高效地实现支持向量机学习就成为一个重要的问题。

SMO算法是一种启发式算法，基本思路如下：

如果所有变量的解都满足此最优化问题的KKT条件，那么得到解。
否则，选择两个变量，固定其它变量，针对这两个变量构建一个二次规划问题，称为子问题，可通过解析方法求解，提高了计算速度。
子问题的两个变量：一个是违反KKT条件最严重的那个，另一个由约束条件自动确定。

SMO算法包括两个部分：

求解两个变量二次规划的解析方法
选择变量的启发式方法

序列最小最优化（sequential minimal optimization，SMO）算法要解如下凸二次规划的对偶问题：
$\begin{align*} \\ & \min_{\alpha} \dfrac{1}{2} \sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_{i} \alpha_{j} y_{i} y_{j} K \left( x_{i}, x_{j} \right) - \sum_{i=1}^{N} \alpha_{i} \\ & s.t. \sum_{i=1}^{N} \alpha_{i} y_{i} = 0 \\ & 0 \leq \alpha_{i} \leq C , \quad i=1,2, \cdots, N \end{align*}$

子问题有两个变量，一个是违反KKT条件最严重的那个，另一个由约束条件自动确定。子问题的两个变量只有一个是自由变量，如果 $\alpha_2$ 确定，那么 $\alpha_1$ 也随之确定，所以子问题中同时更新两个变量。

SMO算法

输入：训练数据集 $T = \left\{ \left( x_{1}, y_{1} \right), \left( x_{2}, y_{2} \right), \cdots, \left( x_{N}, y_{N} \right) \right\}$ ，其中 $x_{i} \in \mathcal{X} = R^{n}, y_{i} \in \mathcal{Y} = \left\{ +1, -1 \right\}, i = 1, 2, \cdots, N$ ，精度 $\varepsilon$ ；

输出：近似解 $\hat \alpha$

取初始值 $\alpha^{0} = 0$ ，令 $k = 0$ ；
选取优化变量 $\alpha_{1}^{\left( k \right)},\alpha_{2}^{\left( k \right)}$ ，求解
$\begin{align*} \\ & \min_{\alpha_{1}, \alpha_{2}} W \left( \alpha_{1}, \alpha_{2} \right) = \dfrac{1}{2} K_{11} \alpha_{1}^{2} + \dfrac{1}{2} K_{22} \alpha_{2}^{2} + y_{1} y_{2} K_{12} \alpha_{1} \alpha_{2} \\ & \quad\quad\quad\quad\quad\quad - \left( \alpha_{1} + \alpha_{2} \right) + y_{1} \alpha_{1} \sum_{i=3}^{N} y_{i} \alpha_{i} K_{i1} + y_{2} \alpha_{2} \sum_{i=3}^{N} y_{i} \alpha_i K_{i2} \\ & s.t. \quad \alpha_{1} + \alpha_{2} = -\sum_{i=3}^{N} \alpha_{i} y_{i} = \varsigma \\ & 0 \leq \alpha_{i} \leq C , \quad i=1,2 \end{align*}$
求得最优解 $\alpha_{1}^{\left( k＋1 \right)},\alpha_{2}^{\left( k+1 \right)}$ ，更新 $\alpha$ 为 $\alpha^{\left( k+1 \right)}$ ；
若在精度 $\varepsilon$ 范围内满足停机条件

$\sum_{i=1}^{N} \alpha_{i} y_{i} = 0$

$0 \leq \alpha_{i} \leq C, i = 1, 2, \cdots, N$

$\begin{align} y_{i} \cdot g \left( x_{i} \right) = \left\{ \begin{aligned} \ & \geq 1, \left\{ x_{i} | \alpha_{i} = 0 \right\} \\ & = 1, \left\{ x_{i} | 0 < \alpha_{i} < C \right\} \\ & \leq 1, \left\{ x_{i} | \alpha_{i} = C \right\} \end{aligned} \right.\end{align}$

其中，
$g(x_i) = \sum_{j=1}^N \alpha_jy_jK(x_j,x_i) + b$
则转(4)；否则令 $k = k + 1$ ，转(2)；

4.取 $\hat \alpha = \alpha^{\left( k + 1 \right)}$ 。

机器学习之SMO算法
SMO算法什么是SMO算法 SMO(Sequential Minmal Optimization)序列最小化算法...
启发式算法
今天看李航博士《统计学习方法》中SVM的学习算法SMO（序列最小最优化算法）中，看到说SMO是一种启发式算法，然后...
序列最小最优算法(SMO算法)
本文来自我的个人博客 https://www.zhangshenghai.com/posts/3981/ 序列最小...
SVM（支持向量机）笔记-SMO算法、核函数，代码实现
SMO算法 SMO表示序列最小优化（Sequential Minimal Optimization），是将大优化问...
12 SVM - SMO - 初始β变量的选择、总结
11 SVM - 序列最小优化算法 SMO 十五、初始β变量的选择回顾: 可以发现SMO算法中，是选择两个合适...
统计机器学习-序列最小最优化算法（SMO）
SMO算法要解如下凸二次规划的对偶问题：在这个问题中，变量是拉格朗日乘子，一个变量对应于一个样本点。变量的总数等...
序列最小优化算法（SMO）浅析
写在前面有一个多月没有更新博客了，整个三月份都在忙项目的事，忙着各种扫尾解决一些“历史遗留问题”。终于到了清明节...
11 SVM - SMO - 序列最小优化算法
05 SVM - 支持向量机 - 概念、线性可分06 SVM - 线性可分模型算法和案例07 SVM - 软间隔模...
SMO算法
SMO算法
SVM算法（支持向量机）
SVM SVM有很多种实现，本文只关注其中最流行的一种实现，即序列最小优化（SMO）算法。支持向量机是一种分类器...