Python数据分析与机器学习29-支持向量机(SVM)

Python数据分析与机器学习29-支持向量机(SVM)

作者: 只是甲 | 来源:发表于2022-07-26 12:38 被阅读0次

Python数据分析与机器学习29-支持向量机(SVM)
支持向量机（SVM）入门理解与推导
7.machine_learning_SVM
[Python] 机器学习笔记基于支持向量机的分类预测
[机器学习入门] 李宏毅机器学习笔记-27（Structured
[机器学习入门] 李宏毅机器学习笔记-28 (Structure
支持向量机(Support Vector Machines-SV
【12%】100小时机器学习——支持向量机SVM
机器学习面试和答案(一)(自己)
python与机器学习（六.支持向量机SVM）

一. 支持向量机概述

image.png

1.1 要解决的问题

什么样的决策边界才是最好的呢？
特征数据本身如果就很难分，怎么办呢？
计算复杂度怎么样？能实际应用吗？

目标：
基于上述问题对SVM进行推导

1.2 决策边界

选出来离雷区最远的（雷区就是边界上的点，要Large Margin）

image.png

1.3 距离的计算

image.png

image.png

image.png

1.4 数据标签定义

数据集：(X1,Y1)(X2,Y2)…(Xn,Yn)

Y为样本的类别：当X为正例时候Y = +1 当X为负例时候Y = -1

决策方程：

image.png

1.5 优化的目标及目标函数

1.5.1 优化目标

通俗解释：
找到一个条线（w和b），使得离该线最近的点（雷区）
能够最远

将点到直线的距离化简得：

image.png

由于

image.png

所以将绝对值展开原始依旧成立

1.5.2 目标函数

放缩变换：
对于决策方程（w,b）可以通过放缩使得其结果值|Y|>= 1
（之前我们认为恒大于0，现在严格了些）

image.png

优化目标：

image.png

由于

image.png

只需要考虑

image.png
目标函数搞定！

当前目标：

image.png

约束条件：

image.png

常规套路：
将求解极大值问题转换成极小值问题
因为通过求导(梯度下降)可以求出极小值，所以很多数学问题最终都是用来求最小值。
至于为什么要加一个1/2，因为使用对数，刚好和平方那个消除了。

image.png

如何求解：
应用拉格朗日乘子法求解

1.6 拉格朗日乘子法

这里我们就不讲解拉格朗日乘子法，直接使用。
带约束的优化问题：

image.png

image.png

原式转换：

image.png

我们的式子：

image.png

约束条件:

image.png

1.7 SVM求解

分别对w和b求偏导,分别得到两个条件（由于对偶性质）

image.png

对w/b求偏导：

image.png

带入原式：

image.png

image.png

image.png

1.8 SVM求解实例

image.png

image.png

image.png

image.png

支持向量：真正发挥作用的数据点，ɑ值不为0的点支持向量机

image.png

1.9 soft-margin

image.png

软间隔：
有时候数据中有一些噪音点，如果考虑它们咱们的线就不太好了

之前的方法要求要把两类点完全分得开，这个要求有点过于严格了，我们来放松一点！

为了解决该问题，引入松弛因子

image.png

新的目标函数：

image.png
当C趋近于很大时：意味着分类严格不能有错误
当C趋近于很小时：意味着可以有更大的错误容忍
C是我们需要指定的一个参数！

拉格朗日乘子法：

image.png

1.10 低维不可分问题

核变换：既然低维的时候不可分，那我给它映射到高维呢？

image.png

目标：找到一种变换的方法，也就是∅（x）

image.png

通过升级维度将我们的特征区分开，那么真正的情况我们是否升级了维度呢?
我们都知道，升级了维度，计算量呈指数型上升，别人的模型可能半个小时就跑出来，你的模型需要数天才可以跑出来，这样的话肯定是不行的。
核函数是在一个低维空间去完成高维样本内积的计算，计算量大大减少。

image.png

高斯核函数：

image.png

线性核函数:

image.png

高斯和函数:
不一定是圆形，也可以是其它

image.png

参考：

https://study.163.com/course/introduction.htm?courseId=1003590004#/courseDetail?tab=1

相关文章

Python数据分析与机器学习29-支持向量机(SVM)
一. 支持向量机概述 1.1 要解决的问题什么样的决策边界才是最好的呢？特征数据本身如果就很难分，怎么办呢？ ...
支持向量机（SVM）入门理解与推导
首先推荐：机器学习实战教程（八）：支持向量机原理篇之手撕线性SVM机器学习实战教程（九）：支持向量机实战篇之再撕非...
7.machine_learning_SVM
1 机器学习支持向量机补充阅读资料：攀登传统机器学习的珠峰-SVM (上)[https://zhuanlan....
[Python] 机器学习笔记基于支持向量机的分类预测
参考资料：阿里云开发者社区 AI项目知乎：机器学习 SVM数据挖掘十大算法详解SVM详解支持向量机（Suppor...
[机器学习入门] 李宏毅机器学习笔记-27（Structured
[机器学习入门] 李宏毅机器学习笔记-27（Structured SVM part 2；结构化支持向量机 part...
[机器学习入门] 李宏毅机器学习笔记-28 (Structure
[机器学习入门] 李宏毅机器学习笔记-28(Structured SVM part 3 ;结构化支持向量机 par...
支持向量机(Support Vector Machines-SV
本文主要是学习支持向量机的算法原理，并且用Python来实现相关算法。内容包括：SVM概述、线性可分支持向量机、线...
【12%】100小时机器学习——支持向量机SVM
总目录链接前言 SVM 支持向量机（SVM）是一个有监督的机器学习算法，可以用于分类和回归分析，最主要是用于分类...
机器学习面试和答案(一)(自己)
参考文章：机器学习：支持向量机SVM之核函数：https://zhuanlan.zhihu.com/p/3029...
python与机器学习（六.支持向量机SVM）
超平面与支持向量将数据集分隔开来的直线称为分隔超平面。如果数据点都在二维平面上，此时分隔超平面就只是一条直线。但...

网友评论

本文标题：Python数据分析与机器学习29-支持向量机(SVM)

本文链接：https://www.haomeiwen.com/subject/sgixirtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python数据分析与机器学习29-支持向量机(SVM)|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！