SVM分类器原理
SVM定义
SVM是一种基于统计学习理论的机器学习方法,它是由BoserGuyo
Vap
ik在COLT92上首次提出,从此迅速发展起来。Vap
ikVN1995TheNatureofStatisticalLear
i
gTheorySpri
gerVerlagNewYorkVap
ikVN1998StatisticalLear
i
gTheoryWileyI
terscie
cePublicatio
Joh
WileySo
sI
cSVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中目前已经在许多智能信息获取与处理领域都取得了成功的应用。
SVM方法的特点
SVM的最终决策函数只由少数的支持向量所确定计算的复杂性取决于支持向量的数目而不是样本空间的维数这在某种意义上避免了“维数灾难”。少数支持向量决定了最终结果这不但可以帮助我们抓住关键样本、“剔除”大量冗余样本而且注定了该方法不但算法简单而且具有较好的“鲁棒”性。这种“鲁棒”性主要体现在①增、删非支持向量样本对模型没有影响②支持向量样本集具有一定的鲁棒性③有些成功的应用中SVM方法对核的选取不敏感。
SVM应用
近年来SVM方法已经在图像识别、信号处理和基因图谱识别等方面得到了成功的应用显示了它的优势。SVM通过核函数实现到高维空间的非线性映射所以适合于解决本质上非线性的分类、回归和密度函数估计等问题。支持向量方法也为样本分析、因子筛选、信息压缩、知识挖掘和数据修复等提供了新工具。SVM训练算法传统的利用标准二次型优化技术解决对偶问题的方法是SVM训练算法慢及受到训练样本集规模制约的主要原因。目前已提出了许多解决方法和改进算法主要是从如何处理大规模样本集的训练问题、提高训练算法收敛速度等方面改进。主要有:分解方法、修改优化问题法、增量学习法、几何方法等分别讨论。
fSVM分类算法训练好SVM分类器后得到的支持向量被用来构成决策分类面。对于大规模样本集问题SVM训练得到的支持向量数目很大则进行分类决策时的计算代价就是一个值得考虑的问题。解决方法如:缩减集ReducedSetSVM方法,采用缩减集代替支持向量集缩减集中的向量不是支持向量数目比支持向量少但它们在分类决策函数中的形式与支持向量相同。多类SVM算法SVM本质上是两类分类器常用的SVM多值分类器构造方法有
SVM方法的特点①非线性映射是SVM方法的理论基础SVM利用内积核函数代替向高维空间的非线性映射②对特征空间划分的最优超平面是SVM的目标最大化分类边际的思想是SVMr