
Spark-Python-KNN:Apache Spark中的一个用于K-NN计算的函数。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Spark Python K-nn 是一种简洁而高效的函数,专门设计用于确定与给定数据点最近的 K 个邻居。为了正确运行此功能,您需要安装依赖项,包括 NumPy 和 scikit-learn。请务必将 `jakac:spark-python-knn:0.0.3` 添加到您的应用程序的依赖项列表中。 具体操作步骤如下:使用 `$SPARK_HOME/bin/pyspark` 命令,并结合 `--packages jakac:spark-python-knn:0.0.3` 参数来启用该库。以下是一个示例 Python 代码片段,展示了如何使用该库:
```python
from gaussalgo.knn import compute_neighbors
import numpy as np
left = sc.parallelize([(1, np.array([0,0,1,1])), (2, np.array([0,1,1,1])), (3, np.array([0,0,1,1])), (4, np.array([1,1,1,1]))])
neighbors = compute_neighbors(left, k=3)
```
全部评论 (0)
还没有任何评论哟~


