本研究探讨了利用支持向量机(SVM)及内核SVM技术对葡萄酒质量进行评估的有效性,通过对比分析展示了内核方法在复杂数据集上的优越性能。
支持向量机(SVM)是一种算法,在N维空间里寻找一个超平面来对数据点进行分类,其中N代表特征的数量。在选择能够区分两类数据的众多可能的超平面上,我们的目标是找到具有最大余量的那个——也就是两个类别间最大的距离。
内核支持向量机(Kernel SVM)是一种技术,在低维输入空间中将问题转换到高维空间里处理,特别适用于解决非线性可分的问题。这使得原本无法通过简单超平面分开的数据点可以在更高维度的空间中找到合适的分割方式。
关于数据集:这些可以看作是分类或回归的任务,并且类别是有顺序的但不均衡(比如普通葡萄酒的数量远多于优质和劣质酒)。输入变量基于理化测试,包括固定酸度、挥发性酸度、柠檬酸含量等;输出变量则是根据感官评价得出的质量评分,在0到10之间。