-
SVM
寻找一条直线或超平面,将输入数据分隔成两类。- 好的分隔线可以最大化间隔
-
最大化Margin
-
SVM
首先考虑是否正确分类,其次才是最大化间隔。 - 同时,可以做到忽略异常值,在忽略异常值和最大间隔之间找到平衡点。
-
sklearn
中的SVM
:import
、fit()
、predict()
- 相对于朴素贝叶斯,线性
SVM
提供一条笔直的决策边界
- 相对于朴素贝叶斯,线性
-
Kernel Trick :特征(维度)变换,可以在构造分类器时通过
kernel
参数进行控制-
Kernel Trick
-
-
参数
kernel
-
C
:在决策边界的正确性和平滑性之间进行平衡。C
值越大,分类越正确,边界越复杂。 -
gamma
:此参数对线性核函数无影响
-
SVM
的优缺点- 在具有明显边界的数据上表现出色
- 海量数据时非常耗时(训练时间与数据量的3次方成正比)
- 噪声过大的数据同样表现不理想
网友评论