本文主要介绍支持向量机理论推导及其工程应用。
1 基本介绍
支持向量机算法是一个有效的分类算法,可用于分类、回归等任务,在传统的机器学习任务中,通过人工构造、选择特征,然后使用支持向量机作为训练器,可以得到一个效果很好的base-line训练器。
支持向量机具有如下的优缺点,
优点:
高维空间有效;
维度大于样本数量的情况下,依然有效;
预测时使用训练样本的子集(也即支持向量),节省内存;
可以使用不同的核函数用于决策;
缺点:
如果特征的数目远远大于样本的数目,性能将会降低;
不能直接提供概率估计,需要通过5-fold 交叉验证来获得;
