Advertisement

阿里云天池大赛杭州地铁客流数据集——Metro_train(2019年1月1日至10日,分三个文件夹上传)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本数据集为2019年初杭州市地铁运行的真实客流记录,涵盖首十日详尽信息,细分为三组文件夹便于访问与分析。 本次大赛的赛题是“地铁乘客流量预测”。参赛者需通过分析历史刷卡数据来预测未来站点客流量的变化,以帮助优化出行路线选择、避免交通拥堵,并提前部署安保措施等,从而利用大数据及人工智能技术保障城市安全出行。 比赛提供了2019年1月1日至1月25日共25天的地铁站刷卡记录作为训练数据(Metro_train.zip),涵盖3条线路81个站点,约7000万条数据。这些训练数据解压后包含25个CSV文件,每个文件代表一天的数据,并以record_为前缀命名,例如所有日期中的第一条记录存储在record_2019-01-01.csv中。 此外,比赛还提供了地铁站之间的连接关系表(Metro_roadMap.csv),用于帮助参赛者构建模型。测试阶段将提供某一天的刷卡数据,要求选手预测未来一天内每十分钟为单位各站点的进、出站人次变化情况。预选赛阶段使用A集作为测试样本,即2019年1月28日的数据记录。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • ——Metro_train(20191110)
    优质
    本数据集为2019年初杭州市地铁运行的真实客流记录,涵盖首十日详尽信息,细分为三组文件夹便于访问与分析。 本次大赛的赛题是“地铁乘客流量预测”。参赛者需通过分析历史刷卡数据来预测未来站点客流量的变化,以帮助优化出行路线选择、避免交通拥堵,并提前部署安保措施等,从而利用大数据及人工智能技术保障城市安全出行。 比赛提供了2019年1月1日至1月25日共25天的地铁站刷卡记录作为训练数据(Metro_train.zip),涵盖3条线路81个站点,约7000万条数据。这些训练数据解压后包含25个CSV文件,每个文件代表一天的数据,并以record_为前缀命名,例如所有日期中的第一条记录存储在record_2019-01-01.csv中。 此外,比赛还提供了地铁站之间的连接关系表(Metro_roadMap.csv),用于帮助参赛者构建模型。测试阶段将提供某一天的刷卡数据,要求选手预测未来一天内每十分钟为单位各站点的进、出站人次变化情况。预选赛阶段使用A集作为测试样本,即2019年1月28日的数据记录。
  • ——Metro_train201911120
    优质
    此数据集为阿里云天池大赛提供的杭州地铁2019年1月11日至20日的详细运营信息,包含多站点客流情况。数据分为三个部分陆续发布。 本次大赛的主题是“地铁乘客流量预测”。参赛者需要通过分析过去25天(从2019年1月1日至1月25日)的地铁站刷卡数据,来构建模型以预测未来站点的客流量变化。这有助于优化出行路线选择、减少交通拥堵,并提前安排车站的安全措施等。 大赛提供的训练资料包括约7000万条记录的数据集(Metro_train.zip),涵盖3条线路及81个站点的历史刷卡信息。此数据集包含25天内每天的刷卡情况,每日期一个CSV文件存储,例如所有在2019年1月1日的刷卡记录保存于record_2019-01-01.csv中。 此外还提供了一份路网地图(Metro_roadMap.csv),展示了各站点之间的连接关系。比赛进入测试阶段时,参赛者需要根据提供的某一天所有线路的所有站点数据预测下一天从零点到二十四小时每十分钟的进站和出站人数变化情况。 在预选赛环节中,选手将使用2019年1月28日的数据作为评估模型性能的基础。
  • ——Metro_train(201912125)
    优质
    该数据集为阿里云天池平台举办的大赛专用资源,包含2019年1月21日至25日期间杭州地铁的客流记录。数据分为三个阶段发布,便于参赛者深入分析和挖掘杭州市公共交通系统的特点与趋势。 本次大赛的赛题是“地铁乘客流量预测”。参赛者需要通过分析历史刷卡数据来预测未来站点的客流量变化,以此帮助优化出行路线选择、避免交通拥堵,并提前部署安保措施等,从而利用大数据与人工智能技术推动城市安全出行的发展。 比赛提供了2019年1月1日至25日共25天内的地铁站刷卡记录作为训练资料(文件名:Metro_train.zip),涵盖3条线路81个站点的约7000万条数据。这些数据解压后会生成包含25个CSV格式的日志,每个文件代表一天的数据,并以record_开头命名,例如,所有发生在2019年1月1日的刷卡记录将存于名为“record_2019-01-01.csv”的文件中。 此外,比赛还提供了地铁站之间的连接关系表(位于Metro_roadMap.csv),以便参赛者更好地理解路网结构。在测试阶段,大赛会提供某一天所有站点的日刷卡数据记录,并要求选手预测未来一天内从凌晨零点到晚上二十四时的每十分钟进、出站人数。 预选赛期间,测试集A将使用2019年1月28日的数据进行评估。
  • 震记录 - 包含 2001 1 1 2023 1 1 的 782 起震事
    优质
    本数据集收录了从2001年1月1日至2023年1月1日期间的782次地震记录,详尽提供每次地震的关键参数。适合地震学研究及灾害预警分析。 数据集包含从2001年1月1日至2023年1月1日期间记录的782次地震事件。各列的具体含义如下: - title:地震标题名称。 - 震级:地震震级大小。 - date_time:地震发生的时间和日期。 - cdi:最大报告强度值,表示该区域感受到的最大破坏程度。 - mmi:仪器测量得出的最大的估计强度数值。 - 警报级别:“绿色”、“黄色”、“橙色”或“红色”,代表不同级别的预警信号。 - 海啸标志:发生于海洋中的地震事件标记为1;其他地区则为0。 - sig:描述了该次事件的重要程度,值越大表示其重要性越高。此数值是根据多种因素综合评估得出的,包括震级、最大MMI强度、报告数量以及预估影响等。 - net:数据提供方ID号,标识用于确定地震信息的主要网络来源。 - nst:为定位该次地震所用到的所有台站总数目。 - dmin:最近观测点与地震中心之间的水平距离(千米)。 - 间隙角差:相邻两个监测站点间最大的角度间距,表示方位差异。一般来说,这个值越小,则表明计算出的地震位置越准确可靠;若该差距超过180度,则意味着所得到的位置及深度数据存在较大不确定性。 - magType:用于确定首选震级的方法或算法类型。 - 深度:地震发生时地壳破裂开始处的具体深度(千米)。 - 纬度和经度坐标:提供了描述地球表面位置的精确地理信息,有助于定位事件发生的地点。 - 位置:具体的位置描述,通常指国内范围内的详细地址或区域名称。 - 大陆:记录了地震发生所在的大陆板块。
  • 201671刷卡
    优质
    该数据记录了2016年7月1日上海市所有地铁线路的乘客刷卡信息,包括进出站时间、地点等详细情况。 数据格式:csv,采用ANSI编码。数据时间范围为2016年7月1日。共有七个字段:卡号、日期、时间、站点名称、交通方式、费用以及是否有优惠信息。该数据集包含了公交刷卡记录,并可以通过筛选“交通方式”来获取特定的出行模式信息,其中非零数值表示出站刷卡记录,而费用为0则代表进站刷卡记录。整个数据集中大约包含700万到900万条记录。
  • 人民报20201202310章TXT
    优质
    该TXT文档汇集了《人民日报》自2020年1月至2023年10月期间发表的文章,内容涵盖政治、经济、文化等多领域重要资讯与深度分析。 《人民日报》作为中国最具影响力的官方媒体之一,其文章内容涵盖了国家政策、社会热点、经济发展、国际关系等多个领域,是研究中国社会动态与舆论导向的重要资料。这个压缩包包含的是2020年1月到2023年10月期间的《人民日报》文章,以txt格式存储,为研究者提供了方便的数据源。 这些txt文档可以用于多种分析任务,其中最常见的就是词频分析。通过统计大量文本中单词出现的频率,我们可以揭示出文本的主题和趋势。例如,通过对这三年多的文章进行分析,我们可以了解到这段时间内社会关注的热点话题,如疫情防控、经济发展策略、科技进步、教育改革、环境保护等关键词的出现频率,并洞察国家政策的重点以及公众舆论的变化。 数据统计分析则更为深入,可以利用自然语言处理(NLP)技术进行情感分析、主题建模和倾向性检测。通过这些方法,我们可以理解公众对特定事件或政策的情感态度,监测舆情;揭示隐藏在大量文本中的核心主题,并找出文章中对某一观点的支持或反对的立场。 此外,这些txt文档还可以作为机器学习和深度学习模型的训练数据,尤其是在处理文本生成、情感分析、命名实体识别以及新闻摘要等任务时。通过利用这些模型,我们可以自动化地处理大量的信息,提高效率并预测未来的社会趋势。 标签“范文模板素材”提示了这些文档的潜在用途。对于学生和研究人员来说,它们可以作为撰写论文或报告的重要参考材料;对教师而言,则是教学中解释时事政治和社会现象的理想工具;而对于新闻工作者和编辑人员,这些文章提供了写作范例,帮助他们学习如何准确、生动地报道事实。 这份压缩包中的txt文档集合是一份宝贵的研究资源,涵盖了近四年重要的社会与政治事件。无论是进行词频分析、数据统计分析还是机器学习训练等任务,它都具有独特价值。通过对这些文本的深入挖掘和研究,我们能够更全面地理解中国近年来的社会变迁与发展脉络。
  • CNNVD历汇总(截2022124
    优质
    本资料汇集了CNNVD自成立以来至2022年1月24日期间的所有关键数据与安全漏洞信息,旨在为用户提供全面的安全事件历史记录和分析。 该文件包含了CNNVD网站上20多年来的漏洞数据。
  • 证指(199012192019531
    优质
    上证指数自1990年12月19日发布以来,作为中国股市的重要指标,记录了上海证券交易所股票价格的变动情况。截至2019年5月31日,该指数反映了中国经济的发展与波动。 上证指数股票价格数据日期范围为1990年12月19日至2019年5月31日。包含的特征有:日期、股票代码、名称、收盘价、最高价、最低价、开盘价、前一交易日收盘价(简称“前收盘”)、涨跌额、涨跌幅以及成交量和成交金额。
  • (2021119更新)
    优质
    该数据集为某一特定研究或应用领域收集整理的一系列信息集合,本次更新于2021年1月19日,新增了多个维度的数据和改进的数据质量。 螺母螺栓数据集包括pos_0.png文件和xxx.jar文件。
  • 20191011更新:最新SCI期刊目录及影响因子(截2020119
    优质
    本文于2019年10月11日更新,提供了最新的SCI期刊列表及其影响因子数据,截止日期为2020年1月19日。 截至2020年1月19日的最新SCI期刊目录在2019年10月11日进行了更新。由于SCI期刊并非实时更新,因此该版本是当时最新的。