本研究通过探索性数据分析方法深入探究了Chocolate Ratings数据集,旨在揭示巧克力评分与各种因素之间的关系和模式。
探索性数据分析(EDA)是数据科学项目中最关键的步骤之一,其基本概念在于通过可视化和描述性统计方法来深入了解数据集。“巧克力”是由经过烘焙和磨碎后的可可豆制成的产品,可以以液体、糊状或块状的形式存在,并且在其他食品中常作为调味剂使用。它深受全世界儿童及成人的喜爱。
本次探索将基于数据分析的周期进行:了解数据背景信息,提出研究问题与假设,清理数据并最终分析结果发现以及给出建议等步骤。本报告详细阐述了对“Chocolate Bar Ratings”这一特定数据集所采取的研究方法和过程。“Chocolate Bar Ratings”包含了来自全球各地共计1795条巧克力棒的相关资料,涵盖其生产地、可可豆原产地及总体评分等多个维度的信息。
该分析基于曼哈顿巧克力协会成员Brady Bruskiewicz所提供的原始数据。