Advertisement

使用Python对数值型特征实施离散化处理的技巧

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本文介绍了利用Python编程语言进行数据预处理时,将连续数值变量转换为离散区间的有效策略和代码实现方法。 如下所示: data = np.random.randn(20) factor = pd.cut(data, 4) pd.get_dummies(factor) 生成的哑变量矩阵如下: ``` (0.173568, -0.29731] (-0.29731, -0.46855] (-0.46855, -0.63979] (-0.63979, -0.81103] 0 0 0 0 1 1 1 0 0 0 2 0 0 0 1 3 0 0 1 0 4 1 0 0 0 5 0 1 0 0 6 0 1 0 0 7 0 1 0 0 8 0 0 1 0 9 0 1 0 0 10 0 0 0 1 11 ... ``` 其中参数中的4表示将数据分成四个区间。

全部评论 (0)

还没有任何评论哟~
客服
客服