
美国人口普查数据-判断年收入是否过5万美金-TensorFlow Decision Forests二分类.ipynb
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本Jupyter Notebook利用TensorFlow Decision Forests模型分析美国人口普查数据,通过训练二分类算法来预测个人年收入是否超过5万美元。
在这里定义数据集的元数据,这些元数据对于根据其类型对输入特征进行编码非常有用。
- 目标列名称。
- 目标列的标签。
- 权重列名称。
- 数值特征的名称:“age”,
- 分类特征及其词汇表。“race”, “sex”, “year”
接下来,我们进行基本的数据准备:
1. 准备数据框架
2. 将目标标签从字符串转换为整数
3. 将分类特征转换为字符串类型
4. 对训练数据和测试数据进行数据框架的准备
现在展示训练和测试数据框的形状,并显示一些实例。
全部评论 (0)
还没有任何评论哟~


