
纽约市出租车大数据分析,在MapReduce和Hadoop框架中进行。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
在本次小组项目中,我们聚焦于“理解出租车经济学”,对纽约市的出租车数据进行了深入分析。这项分析利用了 Map-Reduce 算法,并借助 Hadoop Streaming API 以及 Python 编程语言得以完成。我们的调查旨在探究不同社区的收入水平存在怎样的差异,以及这些差异与当地家庭收入中位数之间是否存在关联。此外,我们还关注收入随时间的变化趋势、出租车公司在不同月份和季节的盈利状况、以及出租车司机在无乘客情况下可行驶的时长及其变化规律。更进一步,我们试图评估重大活动(例如游行、总统访问或风暴)是否会对收入产生影响。 所收集的数据包括2013年出租车数据行程信息、票价数据、人口普查数据以及人口统计信息,同时我们也获得了人口普查区域的形状文件(即“tract”),以及天气数据——具体而言是“Surface Data, Hourly Global”,并选择了纽约市及其三个主要站点作为分析区域。
全部评论 (0)
还没有任何评论哟~


