
通过pandas,数据集被划分成训练集和测试集。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
1、通过调用 `model_select` 模块中的 `train_test_split` 函数,对数据集进行划分。具体采用的是在 Kaggle 平台上用于处理 Titanic 数据集的随机划分方法。首先,导入 pandas 模块以及 sklearn 库中的 `model_select` 模块。随后,使用 pandas 模块读取数据集:`data = pd.read_csv(.../titanic_dataset/train.csv)`。接着,将数据集的特征部分赋值给变量 `x`,并将标签部分赋值给变量 `y`。
全部评论 (0)
还没有任何评论哟~


