Advertisement

Matlab二维光栅代码用于NYC出租车需求预测。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该代码专注于matlab二维光栅,用于预测纽约市出租车需求。2017年4月29日更新,包含新的数据集(包括demand.h5、holiday.txt等),这些数据已于2017-04-12更新。此外,天气数据(Meteorology.h5)也在OneDrive上持续更新。基于两年的原始黄色出租车数据(涵盖2014-07-01至2016-06-30期间),生成的数据量总计约为10GB。为了实现数据生成过程,该流程在Mapreduce工作流中进行了设计和实施,耗时约2.5小时(考虑到处理两年的数据)。该过程可以利用相同的代码在ColumbiaHPC集群上高效运行,需要事先联系相关团队进行协调。Demand.mat文件以Matlab二进制文件格式存储了生成的关键数据,其中包含两个变量:时间表“需求”和地理参考对象“R”。地理参考对象R定义了地理范围信息,例如纬度限制范围,具体值为[40.6769, 40.8868]。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • MATLAB-NYC:NYC_Taxi_Demand_Prediction...
    优质
    本项目运用MATLAB编写二维光栅算法,以预测纽约市(NYC)出租车的需求情况。通过分析历史数据,模型能够有效预测未来需求趋势,优化资源配置。 2017年4月29日更新:新数据(demand.h5、holiday.txt、...)已上传。 2017年4月12日更新:天气数据(Meteorology.h5)已上传。 2017年3月21日更新:HDF5和假日数据已上传。 生成的数据基于两年的原始黄色出租车数据(从2014-07-01到2016-06-30)。目前,仅使用了其中六个月的数据,总大小为10GB。数据生成过程在Mapreduce工作流中设计和实现,处理整个时间段需要大约2.5小时。此流程可以在集群上运行(需联系相关技术支持)。 Demand.mat文件以Matlab二进制格式存储生成的全部数据,并包含两个变量:时间表“需求”以及地理参考对象“R”。其中,“R”提供地理信息(如纬度范围),其具体值为LatitudeLimits:[40.6769,40.8868]。
  • 首尔市数据分析的MapReduce程序:(TaxiPrediction)
    优质
    本项目通过分析首尔市出租车数据,开发了MapReduce程序以预测出租车需求,旨在优化资源配置和提高服务效率。 出租车预测 使用MapReduce程序分析首尔市提供的出租车运营数据以预测特定时间的出租车需求量,并找出一周内需求最高的前10个地区的标准节点链接ID。 开发环境包括: - 操作系统:Ubuntu 14.04 (64位) - 工具:VMware Player,Eclipse平台(Maven项目) - 处理器:单核处理器 - 内存:4GB 目标是使用首尔开放数据广场提供的出租车运营分析数据来确定一周中特定时间需求最高的前10个地区的标准节点链接ID。这些地区能够反映乘客在不同时间段内对出租车服务的需求。 关于“标准节点链接ID”: - 节点是指车辆行驶过程中速度发生变化的地点。 - 链接指的是现实世界中的道路,即连接两个节点之间的路线部分,在此路段上可能会发生速度变化的情况。 - 通过使用这些标准节点链接ID可以获取具体的位置信息。
  • NYC-Yellow-Taxi-Demand-Forecast-for-the-Next-10-Minutes: 纽约市未来10分钟内的黄色
    优质
    本项目专注于预测纽约市未来10分钟内黄色出租车的需求,利用历史数据和机器学习技术,旨在为乘客及运营者提供实时出行建议。 纽约出租车需求预测旨在预测未来10分钟内纽约市黄色出租车的需求量。该Python笔记本使用由出租车及豪华轿车委员会提供的数据来开发机器学习模型,以预测纽约黄色出租车的乘客需求。通过这些数据,可以训练不同的机器学习模型并测试其准确性。 资料包括接送日期/时间、接送地点、旅行距离、逐项列出的票价费率类型、付款方式以及驾驶员报告的乘客人数等信息。首先,我们将进行数据清理并将数据转换为所需的格式。为了将纽约市划分为区域以便于预测特定区域的需求量,我们还将使用K-means算法。 此外,在机器学习模型中,特征重要性是一个关键部分。在此过程中,我们会通过生成具有比率和先前值的特征(t-1)来改进低于基线水平的模型,并计算平均绝对百分比误差。同时,我们将探索移动平均线、加权移动平均线以及指数平滑方法的应用以进一步优化预测结果。
  • 运营数据的短期模型(2016年)
    优质
    本研究构建了一个基于历史运营数据的机器学习模型,用于预测短期内出租车的出行需求,以优化资源配置和提高服务效率。 出租车系统是城市交通运输体系中的关键部分,其规划与调度的合理性直接影响到服务质量。本段落主要探讨了如何通过估计和预测乘客出行需求来优化出租车系统的规划及实时调度策略,提供必要的数据支持。首先,我们分析了现有的出租车定位系统和计费机制,并改进了传统的网格划分方法,在考虑地形、建筑群以及道路网络特点的同时确保每个网格内出行特征的完整性。其次,基于收集到的实际出租车运营数据,构建了一种易于操作的需求评估模型。最后,通过实际数据分析影响短时需求的关键变量之间的关系,并提出一种基于人工神经网络的短期需求预测模型,根据相关性分析确定了该模型的主要参数。
  • 纽约
    优质
    本项目旨在开发一个模型,用于预测纽约市出租车及豪华轿车的乘车费用。通过分析历史数据和运用机器学习技术,为乘客提供准确的成本估算服务。 纽约出租车车费预测
  • 自行
    优质
    自行车出租预测专注于分析城市中自行车共享系统的需求模式,利用数据科学方法预测高需求时段与地区,旨在优化车辆分布和提升用户体验。 根据一个城市自行车租赁系统提供的数据,在2年内华盛顿按小时记录的自行车租赁情况中,训练集由每个月的前19天组成,测试集则包含每月20号及之后的数据(需要我们自己去预测)。使用随机森林回归算法实现对自行车租赁量的预测。
  • 纽约市竞赛:在Kaggle上建模
    优质
    本竞赛要求参赛者基于纽约市丰富的出租车数据,在Kaggle平台上构建模型以预测出租车费用。参与者需运用统计学和机器学习技术,优化其模型准确度,以期在众多选手中脱颖而出。 纽约市出租车票价预测Kaggle竞赛建立了一个用于预测纽约市出租车费率的模型。
  • 模型】BP神经网络停【附Matlab 765期】.zip
    优质
    本资料提供基于BP(Back Propagation)神经网络的停车需求预测模型,并包含详细的Matlab实现代码,适用于交通工程及城市规划研究。 【预测模型】BP神经网络停车位预测【含Matlab源码 765期】.zip
  • nyc-taxi-data-insights:解析200GB纽约市数据集
    优质
    nyc-taxi-data-insights项目专注于深入分析200GB规模的纽约市出租车出行大数据集,揭示城市交通模式和趋势。 如何使用AWS EC2 Hadoop集群处理200GB数据 存储200 GB的NYC出租车数据集,并部署Cloudera Hadoop集群以对其进行可视化。 利用Python中的Datashader绘制并可视化Hadoop大型数据集,同时展示没有使用Datashader进行可视化的效果对比。 工作流程概述: 1. 首先在AWS EC2上建立一个Hadoop集群。 2. 将NYC出租车的大量数据上传至该集群,并存储于分布式文件系统中(如HDFS)。 3. 使用Cloudera提供的工具和服务来管理Hadoop生态系统,包括但不限于YARN和Spark等组件。 使用数据着色器: 1. 安装Python库Datashader,它能够处理大规模的数据集并生成图像表示。 2. 编写脚本从存储在HDFS上的出租车数据集中提取所需信息,并利用这些信息通过Datasheder进行可视化操作。 3. 调整参数和配置选项以优化最终的视觉效果。 最终可视化: 展示使用了Datashader技术处理后的NYC出租车数据库,这将能够更高效地揭示隐藏于庞大数量级下的模式与趋势。
  • 纽约市数据集
    优质
    本数据集包含纽约市出租车详尽的行程记录,涵盖出发地、目的地及相应费用信息,旨在帮助用户准确预测出租车出行成本。 纽约市出租车票价预测的数据集包含8个字段:键(key)、票价金额(fare amount)、接送日期时间(pickup datetime)、接送经度(pickup longitude)、接送纬度(pickup latitude)、下车经度(dropoff longitude)、下车纬度(dropoff latitude)和乘客数量(passenger count)。