
Amazon评分预测
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目旨在通过分析用户行为和产品评论等数据,构建模型以预测亚马逊平台上商品的评分情况,为商家提供优化建议。
在2020年11月创建了一个二进制分类器来预测亚马逊产品评论的好评度。如果预测评分高于4.4分(满分5分),则认为该产品非常出色。
经过模型训练,在验证组上进行的十倍交叉验证获得了F1得分为0.88,而在测试组上的F1得分是0.86。
数据集包括:
- 训练组合:921,782条评论,涵盖33,056种独特的产品;
- 测试集合:222,078条评论,涉及8,264种独特的商品。
通常的做法是从每个评论中预测多类别评分(1至5分),然后计算每款产品的平均评级。如果平均评分高于4.4,则最终将该产品归类为“超赞”。
一种改进方法是先进行多分类预测作为二元分类的中间步骤,这使得F1得分提高了6%。
数据预处理包括清理评论和摘要条目,并生成相关功能。
在训练集上拟合逻辑回归模型后,使用验证组来评估性能。最后,在测试集合中做出预测并输出结果。
全部评论 (0)
还没有任何评论哟~


