
对Kaggle红酒质量数据集开展探索性分析
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目通过对Kaggle红酒质量数据集进行深入分析,揭示影响红酒品质的关键因素,为葡萄酒行业提供有价值的数据支持和见解。
通过探索性数据分析发现机器学习模型表明所有特征都对葡萄酒质量有影响。在考虑各变量的相关性时,我们注意到一些特征之间存在关联,例如固定酸度、柠檬酸等与pH值相关联的特性。研究的主要结论是:酸度显著影响葡萄酒的质量;消费者普遍认为优质葡萄酒不应含有过多残糖,即非常甜的酒不被视为高质量;此外,酒精含量增加被认为是优质葡萄酒的一个特点,但不宜过高以免被归类为烈性酒。
在模型性能方面,堆叠分类器和随机森林分类器的表现优于其他模型。其中,堆叠分类器具有最高的准确性(85.94%)。值得注意的是,在未进行SMOTE重采样的情况下,这些模型的准确度略有提高。因此,在不使用数据重新采样技术的情况下获得的最佳模型表现最佳。
为了进一步提升模型性能,可以通过scikit-learn随机网格搜索来调整堆叠分类器和随机森林分类器的超参数设置。
全部评论 (0)
还没有任何评论哟~


