Advertisement

20个用于Weka的机器学习开源软件实验数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本资料汇集了适用于Weka平台的20个机器学习开源实验数据集,涵盖广泛的数据类型与问题场景,旨在促进算法测试和模型开发。 压缩包包含20个.arff数据集,这些数据集来自机器学习和数据挖掘开源软件Weka自带的数据集。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 20Weka
    优质
    本资料汇集了适用于Weka平台的20个机器学习开源实验数据集,涵盖广泛的数据类型与问题场景,旨在促进算法测试和模型开发。 压缩包包含20个.arff数据集,这些数据集来自机器学习和数据挖掘开源软件Weka自带的数据集。
  • ARFF大全(Weka必备)
    优质
    ARFF数据集大全是一份全面整理和分类的数据集合资源库,专为使用Weka工具进行机器学习研究与应用的设计者、开发者及研究人员提供不可或缺的基础资料。 目录列表如下: 2dplanes.arff abalone.arff ailerons.arff Amazon_initial_50_30_10000.arff anneal.arff anneal.ORIG.arff arrhythmia.arff audiology.arff australian.arff auto93.arff autoHorse.arff autoMpg.arff autoPrice.arff autos.arff auto_price.arff balance-scale.arff bank.arff bank32nh.arff bank8FM.arfffaskball(araff) bodyfat(araff) bolts(araff) breast-cancer(araff) breast-w(araff) breastTumor(araff) bridges_version1.arff bridges_version2.arff cal_housing(arff) car.arff cholesterol.arff cleveland.arff cloud.arff cmc(araff) colic(araff) colic.ORIG(araff) contact-lenses(araff) cpu(araff) cpu.with.vendor(araff) cpu_act(araff) cpu_small(araff) credit-a(araff) credit-g(araff) cylinder-bands.arff delta_ailerons.arff delta_elevators.arff dermatology(araff) detroit.arff diabetes(araff) diabetes_numeric(araff) echoMonths(araff) ecoli(araff) elevators(araff) elusage(araff) eucalyptus(araff) eye_movements(araff) fishcatch.arff flags.arfffried.arff fruitfly(arff) gascons.arf glass(arff) grub-damage(arff) heart-c(arff) heart-h(arff) heart-statlog(arff) hepatitis(arff) house_16H(araff) house_8L(araff) housing.arfaar hungarian(aaraff) hypothyroid(aafrrf) ionosphere.afrfffir.arfffffffffffishcatch.aarrfftflags.aaarraaarfried.arrf fruitfly(arrff) gascons(afrr)f glass(ffrfggrub-damage(arff)heart-c(arff) heart-h(araff) heart-statlog(aarffghepatitis(aarfffhouse_16H(aaarrfhous_e8L(eaaffeaaasaaahungarian(aaarfaarfhyhypothyroid(afrrf)fioionosphere.afrffffffffffiris.2D.ffrfffffffkdd_coil_test-1.arff kdd_coil_test-2.arff kdd_coil_test-3.arff kdd_coil_test-4.arff kdd_coil_test-5.arff kdd_coil_test-6.arff kdd_coil_test-7.arff kdd_coil_train-1.aarffffffffff kdd_coil_train_3(araff) kdd_coil_train_4(aarrf) kdddd_cooi_trai5n_aafrrfff kddd_cool_tra6in_arrfff kddd_coii_t7rain_arff kd_dcoiltrain8arffffffffff kdd_el_nino-small.arff kdd_internet_usage.afrfffkdd_ipums_la_97-small(araff) kdd_ipums_la_98-small(aarrf) kddddd_iuumpms_laa_a099-_smal(arrfaaaf kddd__i_pum_smlaaa_a10-___smaaaallff kdd_JapaneseVowels_test(araff) kdd_JapaneseVowels_train(aarfffkdd_synthetic_control.arfffkdd_SyskillWebert-Bands.aarrfkkdddd___Syssillweberrt---Biiiooomedical.aaaarf kddd__Syskil_webrrtt--ggooaats_aafraaa kd_dsyskiwlberr-t_sheep_arrffffffffff kdd_UNIX_user_data.arff kin8nm(araff) kr-vs-kp(aarfffllabor(arrf) landsat_test.aarrff landsat_train(afrfffffffweather.nominal.aaaarf weather.numeric.arrffffffffffzoo.aafrr 以上为文件目录列表。
  • weka全面
    优质
    Weka是一款用于数据挖掘任务的强大工具,它提供了一个庞大的数据集资源库,涵盖广泛的领域和应用。 我们提供了一套完整的Weka软件数据集集合,共有189个数据集。这些数据集可用于训练和测试各种模型,涵盖天气、车辆以及肝脏肿瘤等多个领域。所有文件均采用ARFF格式存储。
  • 27
    优质
    本资料整理了涵盖广泛领域的27个常用机器学习数据集,适用于初学者与进阶者进行模型训练和算法测试。 本段落介绍了27个常用的机器学习数据集,包括iris、bank、airline、soybean、weather、credit和unbalanced等。
  • 1.zip
    优质
    本资料包包含用于机器学习课程的第一个实验的数据集。内容包括多种格式的数据文件和相应的实验指导书,旨在帮助学生理解和应用基本的机器学习算法和技术。 机器学习是一门跨学科领域,融合了概率论、统计学、逼近论、凸分析以及算法复杂度理论等多个领域的知识。它研究计算机如何模仿或实现人类的学习行为,以获取新的技能与知识,并优化现有的信息结构来提升自身的性能表现。 作为人工智能的核心部分,机器学习为使计算机具备智能提供了关键路径。随着统计方法的不断进步,统计学习在这一领域的重要性日益凸显,支持向量机(SVM)、决策树和随机森林等算法的发展使得处理分类、回归及聚类问题变得更加高效准确。进入21世纪以来,深度学习成为了机器学习领域的重大突破之一;通过使用多层神经网络模型,并借助大规模数据集与强大计算资源进行训练,在计算机视觉、自然语言理解和语音识别等多个方面取得了显著成果。 目前,机器学习算法在众多行业都有广泛的应用实例,包括但不限于医疗保健、金融服务、零售电商以及智能交通等。例如,在医疗领域中,该技术能够帮助医生更准确地解读医学影像资料,并支持疾病的早期诊断与治疗规划;而在金融行业中,则可以通过分析大量交易数据来识别潜在风险并预测市场趋势。 展望未来,随着传感器技术和计算能力的不断增强,机器学习将在自动驾驶汽车及智能家居等领域展现更大的潜力。同时,在物联网日益普及的趋势下,该技术将助力各种智能设备实现更加个性化且智能化的功能特性。此外,在工业制造领域内也存在广泛的应用前景和发展空间,例如智能制造、工艺流程优化以及产品质量控制等方面。 综上所述,作为一门充满广阔应用价值与深远影响的学科,机器学习将继续推动人工智能技术的进步,并为人类社会的发展贡献重要力量。
  • 50优秀.doc
    优质
    这份文档提供了50个精选的机器学习公开数据集列表,涵盖计算机视觉、自然语言处理等多个领域,旨在帮助研究者和开发者提高模型训练效率与准确性。 在这里为大家整理了50个最佳的机器学习公共数据集,这些数据集免费提供给大家使用和研究。
  • 23 优质训练公
    优质
    本文整理了23个优质且实用的机器学习训练数据集,涵盖图像识别、自然语言处理等多个领域,旨在为研究人员和开发者提供便捷的学习资源。 你是否已经对Iris数据集感到厌倦了呢?请勿误会我的意思,对于初学者来说,Iris数据集的确是一个很好的入门选择。然而,在网络上还有许多有趣的公共数据集可以用来进行机器学习和深度学习的练习。在这篇文章中,我将分享23个优秀的公共数据集,并介绍这些数据集中包含的数据示例以及它们各自能够解决的问题。 以下是这23个公共数据集: 1. 帕尔默企鹅数据集 2. 共享单车需求数据集 3. 葡萄酒分类数据集 4. 波士顿住房数据集 5. 电离层数据集 6. Fashion MNIST 数据集 7. 猫与狗数据集 8. 威斯康星州乳腺癌(诊断)数据集 9. Twitter 情绪分析和 Sentiment140 数据集 10. BBC 新闻数据集 11. 垃圾短信分类器数据集 12. CelebA 数据集 13. YouTube-8M 数据集 14. 亚马逊评论数据集 15. 纸币验证数据集 16. LabelMe 数据集 17. 声纳数据集 18. 皮马印第安人糖尿病数据集 19. 小麦种子数据集 20. Jeopardy! 数据集 21. 鲍鱼数据集 22. 假新闻检测数据集 23. ImageNet 数据集
  • 665坑洞
    优质
    机器学习665个坑洞数据集提供了一个包含多种陷阱和挑战的真实案例集合,旨在帮助研究者识别并避免常见的错误与偏差。此资源适用于希望提升模型稳健性的个人或团队。 665张坑洞数据。