Advertisement

KDD Cup 2018新鲜空气竞赛

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
KDD Cup 2018新鲜空气竞赛是数据挖掘领域的顶级赛事KDD Cup的一部分,旨在通过数据分析和机器学习技术来预测北京地区的空气质量指数。参赛者利用历史气象与环境监测数据,建立模型以改善城市居民的生活质量,并为环保政策提供科学依据。 在KDDCup 2018数据集中进行的数据清洗主要针对缺失值和异常数据的处理。对于某一天除站点位置外所有空气质量信息全部缺失的情况直接删除该行,而对于部分数据缺失则尝试填充。我们测试了使用零、平均数以及前驱数据(即时间序列中紧邻之前的数值)来填补空缺的方法,发现采用前驱数据进行填充能够较好地保持随时间变化的趋势而不破坏其平滑性。 此外,在清洗过程中还需处理异常值的问题,例如静风时的风速表示和明显偏离正常范围的数据。对于这些情况通常使用在合理范围内随机生成的新数值来替换原有异常值,并且删除了zhiwuyuan站点中出现的一行全部用999标识的脏数据以及一段时间内的类似问题记录。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • KDD Cup 2018
    优质
    KDD Cup 2018新鲜空气竞赛是数据挖掘领域的顶级赛事KDD Cup的一部分,旨在通过数据分析和机器学习技术来预测北京地区的空气质量指数。参赛者利用历史气象与环境监测数据,建立模型以改善城市居民的生活质量,并为环保政策提供科学依据。 在KDDCup 2018数据集中进行的数据清洗主要针对缺失值和异常数据的处理。对于某一天除站点位置外所有空气质量信息全部缺失的情况直接删除该行,而对于部分数据缺失则尝试填充。我们测试了使用零、平均数以及前驱数据(即时间序列中紧邻之前的数值)来填补空缺的方法,发现采用前驱数据进行填充能够较好地保持随时间变化的趋势而不破坏其平滑性。 此外,在清洗过程中还需处理异常值的问题,例如静风时的风速表示和明显偏离正常范围的数据。对于这些情况通常使用在合理范围内随机生成的新数值来替换原有异常值,并且删除了zhiwuyuan站点中出现的一行全部用999标识的脏数据以及一段时间内的类似问题记录。
  • KDD Cup 2012 道1数据集
    优质
    KDD Cup 2012赛道1数据集是针对广告点击预测任务设计的数据集合,包含了大量在线广告展示和用户交互信息,旨在促进机器学习社区在该领域的研究与应用。 KDD Cup 2012 Track1 数据集包含了用户特征和Item特征。数据文件可以通过百度云链接快速下载。
  • KDD Cup 数据集
    优质
    KDD Cup数据集是每年知识发现与数据挖掘会议(KDD)中数据挖掘竞赛使用的标准数据集合,用于促进数据科学和机器学习的研究与发展。 KDDCUP数据集是一个完整的入侵检测数据集,包含了多种攻击方式的数据。
  • 2018年创.zip
    优质
    《2018年创新屋竞赛》汇集了当年最杰出的学生创意项目和解决方案,展现了年轻一代在科技、工程及设计领域的无限潜能与创新能力。 2018年创新屋比赛资料.zip
  • NSL-KDD(1999 KDD Cup数据集的重采样版)
    优质
    NSL-KDD是基于1999年KDD Cup数据集改进而来的一个网络入侵检测基准数据集,通过重采样处理以提高机器学习模型训练和测试的有效性。 NSL-KDD是KDD Cup 1999数据集的重新采样版本,其训练集包含125973个样本,测试集包含22544个样本,每个样本有41个特征。在训练集中,正常和异常类别的比例为67343:58630,这解决了KDD99数据集中类别不平衡的问题。
  • KDD Cup 99 数据合集.zip
    优质
    此资料为KDD Cup 99竞赛的数据集合,包含电信公司呼叫数据,可用于客户分类、欺诈检测等数据分析和机器学习任务。 KDD CUP99数据集用于入侵检测,包含测试集、训练集以及各占10%的子集。
  • KDD Cup 2022风力发电数据集.zip
    优质
    该压缩文件包含KDD Cup 2022竞赛中使用的风力发电数据集,内含详细的历史气象与发电量信息,适用于数据分析和机器学习研究。 KDD Cup 2022风力发电预测数据集提供了龙源电力集团有限公司独特的空间动态风力预测数据:SDWPF,其中包括风力涡轮机的空间分布以及时间、天气和涡轮机内部状态等动态背景因素。然而,大多数现有的数据集和竞赛将风力功率预测视为单纯的时间序列问题,并未考虑风力涡轮机的位置及其上下文信息。
  • KDD 2015年慕课辍学率预测
    优质
    简介:KDD 2015年慕课辍学率预测竞赛是一场数据挖掘与知识发现大会(KDD)举办的赛事,参赛者通过分析大规模在线开放课程的数据来预测学生的辍学概率。 KDD 2015年竞赛的代码已经全部公开,用于预测慕课辍学率,准确率达到接近95%。
  • KDD Cup 2015:预测MOOC学员流失(2015年)
    优质
    简介:KDD Cup 2015竞赛聚焦于大规模开放在线课程(MOOC)中学生流失问题,旨在通过数据分析预测哪些学生可能会辍学,从而提出改进措施。 kddcup-2015 2015年KDD杯-预测MOOC辍学信息:团队:ttllbb