支持向量机原理(四)SMO算法原理

刘建平Pinard

分类：机器学习

发布时间 2022.11.08阅读数 1978 评论数 0

　在SVM的前三篇里，我们优化的目标函数最终都是一个关于 $α$ 向量的函数。而怎么极小化这个函数，求出对应的 $α$ 向量，进而求出分离超平面我们没有讲。本篇就对优化这个关于 $α$ 向量的函数的SMO算法做一个总结。

1. 回顾SVM优化目标函数

　　　　我们首先回顾下我们的优化目标函数：

2. SMO算法的基本思想

3. SMO算法目标函数的优化

　　　　为了求解上面含有这两个变量的目标优化问题，我们首先分析约束条件，所有的 $α_{1}, α_{2}$ 都要满足约束条件，然后在约束条件下求最小。

　　　　根据上面的约束条件 $α_{1} y_{1} + α_{2} y_{2} = ς 0 \leq α_{i} \leq C i = 1, 2$ ，又由于 $y_{1}, y_{2}$ 均只能取值1或者-1, 这样 $α_{1}, α_{2}$ 在[0,C]和[0,C]形成的盒子里面，并且两者的关系直线的斜率只能为1或者-1，也就是说 $α_{1}, α_{2}$ 的关系直线平行于[0,C]和[0,C]形成的盒子的对角线，如下图所示：

4. SMO算法两个变量的选择

　　　　SMO算法需要选择合适的两个变量做迭代，其余的变量做常量来进行优化，那么怎么选择这两个变量呢？

4.1 第一个变量的选择

　　　　SMO算法称选择第一个变量为外层循环，这个变量需要选择在训练集中违反KKT条件最严重的样本点。对于每个样本点，要满足的KKT条件我们在第一节已经讲到了：

α * i = 0 \Rightarrow y i g (x i) \geq 1

0 < α * i < C \Rightarrow y i g (x i) = 1

α * i = C \Rightarrow y i g (x i) \leq 1

　　　　一般来说，我们首先选择违反 $0 < α_{i}^{*} < C \Rightarrow y_{i} g (x_{i}) = 1$ 这个条件的点。如果这些支持向量都满足KKT条件，再选择违反 $α_{i}^{*} = 0 \Rightarrow y_{i} g (x_{i}) \geq 1$ 和 $α_{i}^{*} = C \Rightarrow y_{i} g (x_{i}) \leq 1$ 的点。

4.2 第二个变量的选择

　　　　SMO算法称选择第二一个变量为内层循环，假设我们在外层循环已经找到了 $α_{1}$ , 第二个变量 $α_{2}$ 的选择标准是让 $| E 1 - E 2 |$ 有足够大的变化。由于 $α_{1}$ 定了的时候, $E_{1}$ 也确定了，所以要想 $| E 1 - E 2 |$ 最大，只需要在 $E_{1}$ 为正时，选择最小的 $E_{i}$ 作为 $E_{2}$ ， $E_{1}$ 为负时，选择最大的E $E_{i}$ 作为 $E_{2}$ ，可以将所有的 $E_{i}$ 保存下来加快迭代。

　　　　如果内存循环找到的点不能让目标函数有足够的下降，可以采用遍历支持向量点来做 $α_{2}$ ,直到目标函数有足够的下降，如果所有的支持向量做 $α_{2}$ 都不能让目标函数有足够的下降，可以跳出循环，重新选择 $α_{1}$ 　

4.3 计算阈值b和差值 $E_{i}$

$E_{i}$

. SMO算法总结

　　　　输入是m个样本 $(x_{1}, y_{1}), (x_{2}, y_{2}), . . ., (x_{m}, y_{m}),$ ,其中x为n维特征向量。y为二元输出，值为1，或者-1.精度e。

　　　　输出是近似解 $α$

　　　　1)取初值 $α^{0} = 0, k = 0$

　　　　2)按照4.1节的方法选择 $α_{1}^{k}$ ,接着按照4.2节的方法选择 $α_{2}^{k}$ ，求出新的 $α_{2}^{n e w, u n c}$

$α_{2}^{n e w, u n c}$

SVM 支持向量机分类算法 SMO算法目标函数

打赏 0

上一篇：支持向量机原理(三)线性不可分支持向量机与核函数

下一篇：scikit-learn决策树算法类库使用小结

支持向量机原理(四)SMO算法原理

刘建平Pinard

1. 回顾SVM优化目标函数

2. SMO算法的基本思想

3. SMO算法目标函数的优化

4. SMO算法两个变量的选择

4.1 第一个变量的选择

4.2 第二个变量的选择

4.3 计算阈值b和差值Ei

. SMO算法总结

为你推荐

DI-engine强化学习入门（十）如何使用RNN——模型构建和包装

[BPnet识别MNIST07]神经网络的实现以及调优

微调Hugging Face中图像分类模型

基于信息增益的决策树

无人驾驶技术入门（十九）| 手把手教你实现多传感器融合技术

【深度学习 学习率，优化器】——深刻解读训练网络时各种学习率，优化器的区别，learning rate, Momentum

评论（0）

关于作者

刘建平Pinard

57

0

50

4

支持向量机原理(四)SMO算法原理

支持向量机高斯核调参小结

强化学习（二）马尔科夫决策过程(MDP)

相关推荐

数学建模算法学习笔记

Paper 6. Deep Reinforcement Learning for AutonomousDriving

增强学习在导航中的应用

「RL篇 贰」DQN 原理与实战

行人重识别(3)——行人重识别（基于图像）综述

精选深度学习PyTorch笔记（3）：Tensor的索引

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

4.3 计算阈值b和差值 $E_{i}$

【深度学习学习率，优化器】——深刻解读训练网络时各种学习率，优化器的区别，learning rate, Momentum

「RL篇贰」DQN 原理与实战

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板