
使用Python对数值型特征实施离散化处理的技巧
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了利用Python编程语言进行数据预处理时,将连续数值变量转换为离散区间的有效策略和代码实现方法。
如下所示:
data = np.random.randn(20)
factor = pd.cut(data, 4)
pd.get_dummies(factor)
生成的哑变量矩阵如下:
```
(0.173568, -0.29731] (-0.29731, -0.46855] (-0.46855, -0.63979] (-0.63979, -0.81103]
0 0 0 0 1
1 1 0 0 0
2 0 0 0 1
3 0 0 1 0
4 1 0 0 0
5 0 1 0 0
6 0 1 0 0
7 0 1 0 0
8 0 0 1 0
9 0 1 0 0
10 0 0 0 1
11 ...
```
其中参数中的4表示将数据分成四个区间。
全部评论 (0)


