
泰坦尼克号的数据挖掘案例
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
泰坦尼克号的数据挖掘案例探讨了通过分析该历史事件中的乘客数据来预测生存概率的方法,展示数据科学在理解人类历史关键时刻的应用。
目录:
一. 数据挖掘流程
1. 数据读取与统计分析
2. 特征分析 & 缺失值填充
2.1 性别与获救情况
2.2 船舱等级与获救关系
2.3 年龄分布及对获救的影响
2.4 姓名(称谓)与生存几率关联性分析
2.5 缺失值填充方法
2.6 登船地点与获救情况考察
2.7 兄弟姐妹数量统计
2.8 父母和孩子数量对结果影响评估
2.9 船票价格分析
3. 特征相关性研究
3.1 相关性热度图绘制
3.2 热度图下三角可视化
4. 构建特征
4.1 年龄特征构建
4.2 家庭总人口统计
4.3 船票价格分析
4.4 类型转换与特征清洗
5. 机器学习模型建立
5.1 训练集和测试集划分
5.2 Logistic回归应用
5.3 支持向量机建模
5.4 决策树构建
5.5 随机森林算法
全部评论 (0)
还没有任何评论哟~


