
Yelp数据挑战:运用机器学习算法开展数据分析、建模及推荐系统的实战练习
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目通过应用机器学习技术于Yelp数据集,进行深入的数据分析和模型构建,并开发有效的推荐系统,提供实践操作经验。
Yelp数据挑战赛旨在通过机器学习算法进行数据分析、建模和推荐系统的实际应用。以下是对该比赛的数据集的简要介绍:
**数据集简介**
- **用户评论与提示**: 数据集中包含100万用户的评价,涉及14.4万家企业的410万条评论以及94.7万个提示信息。
- **企业属性**: 包括约110万个业务细节,如营业时间、停车位情况和氛围描述等。
- **入住记录**: 从参赛数据中抽取的125,000家公司的历史注册情况随时间的变化趋势。
**城市分布**
该挑战赛的数据覆盖了多个国际城市:
- 英国:爱丁堡
- 德国:卡尔斯鲁厄
- 加拿大:蒙特利尔和滑铁卢
- 美国:匹兹堡、夏洛特、厄巴纳香槟(Urbana-Champaign)、凤凰城、拉斯维加斯、麦迪逊以及克利夫兰
**文件格式**
数据以JSON格式提供,具体包括:
- yelp_academic_dataset_business.json
- yelp_academic_dataset_checkin.json
全部评论 (0)
还没有任何评论哟~


