
KMeans-PySpark:在Spark中的Python分布式K-means聚类实现
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目为基于Apache Spark平台的Python实现的分布式K-means算法。旨在高效处理大规模数据集上的无监督学习任务。
为了确保本地开发与运营的顺利进行,请确认已安装Python 2.7以及pip工具。接下来运行命令:`pip install -r requirements.txt`。
正在执行的工作使用中央作业管理模块中的src/index.py文件来启动所有任务,无需对此文件做任何修改。通过以下格式调用python脚本以指定具体操作:
```
python src/index.py
全部评论 (0)
还没有任何评论哟~


