本项目致力于通过数据分析和机器学习技术对葡萄生长周期中的各类影响因素进行研究,旨在建立一套精准的葡萄质量预测模型。此模型能够帮助葡萄种植者提前预知葡萄的质量状况,从而优化种植管理策略,提高产量与品质,最终助力葡萄酒酿造产业实现智能化、精细化发展。
葡萄酒品质预测任务的目标是开发一种模型,利用葡萄酒的某些特性来预测白葡萄酒的质量。响应变量Y表示的是葡萄酒质量得分,这是一个介于1到3之间的序数变量:1代表较低、2代表中等和3代表较高。
数据集包含2000个观测值,输入变量包括固定酸度、挥发性酸度、柠檬酸含量、残留糖分、氯化物浓度、游离二氧化硫量、总二氧化硫量、密度、pH值以及硫酸盐和酒精的含量。预测序数变量的问题很有趣,因为有多种方法可以处理这类问题。
以下文章对这个问题提供了有趣的概述:古铁雷斯(Gutierrez)、佩雷斯·奥尔蒂斯(Perez-Ortiz)、桑切斯·莫内德罗(Sanchez-Monedero, J.)、费尔南德斯·纳瓦罗(Fernandez-Navarro, F.)和赫尔瓦斯·马丁内兹(Hervas-Martinez, C.),2015年发表于《IEEE Transactions on Knowledge》。