‖‖即为分类超平面1和分类超平面1之间的距离。
图422SVM线性可分示意图
f实际上,由于在求解‖‖的过程中会涉及到开根号,所以为了简化运算提高
1
精度,常常用2‖‖2来代替‖‖(这种替换不会改变和b的值)。因此,先前的
寻优问题就可以转化为数学上的二次规划的优化问题,即:
求目标函数
1
1
‖‖2
2
2
在约束条件:
≥1,12…
下的最小值。
这种求条件极值的问题,可用拉格朗日乘数法解决。故,可首先定义一个拉
格朗日函数:
1
‖‖2∑1
2
1
上式中的是KKT乘数,故满足KKT条件:
即,
10,12…
因此只有少部分不等于0,其对应的样本就是支持向量。支持向量从数
学表达式上来看,就是使不等式:≥1等号成立的那些样本;从几
何学上来说,就是那些通过分类超平面1和分类超平面1
的样本(如图所示)。
然后,分别对拉格朗日函数中的和求偏导数,并令其等于0后,
可求得:
∑0;∑
1
1
进而,就可以在此求得的结果的基础之上把上述优化问题进一步地转化为如
下最优问题:
对求目标函数:
1
1
1
∑∑
2
在约束条件
∑0且≥0,12…
1
f下的最大值。
由于上述优化问题是从本质上看是二次函数求极值的问题,故存在最优解。
若把该解记为,则可最终求得:
∑
1
在此基础之上,可最终解出我们所寻求的最优分类超平面所对应的最优分类
函数的函数表达式:
∑
1
上式中,为符号函数;可通过和任意≠0所对应的支持向量,
根据公式10求得。
以上就是标准SVM分类算法在处理线性可分数据的分类问题时的主要内容
和过程。
43
非线性可分SVM
当我们所面对的是非线性可分的训练数据时,标准的SVM分类算法的处理方
式是这r