
大数据仓库及大数据挖掘课程的教学设计.doc
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文档探讨了针对大数据仓库与大数据挖掘课程的教学设计方案,旨在提升学生在数据分析和数据科学领域的技能与理解。
目录
1. 绪论
1.1项目背景
1.2 提出问题
2 数据库仓库与数据集的概念介绍
2.1数据仓库
2.2数据集
3 数据仓库
3.1 数据仓库的设计
3.1.1数据仓库的概念模型设计
3.1.2数据仓库的逻辑模型设计
3.2 数据仓库的建立
3.2.1数据仓库数据集
3.2.2建立维表
4 数据挖掘操作
4.1数据预处理
4.1.1描述性数据汇总
4.2决策树
5 实验心得
6 大总结
绪论
在大数据时代,各行各业需要对商品及相关信息的数据进行收集和处理。尤其对于零售行业而言,企业为了科学合理地分析产品的市场需求,并预测未来的市场趋势以制定高效的经营策略从而获取经济收益。
1.2 提出问题
如何决定超市的商品购买时间和数量以便最大化销售量、避免库存积压或缺货?这需要根据不同时间段的季节性和不同的人群来定制不同的方案,通过数据挖掘技术进行决策树分析、关联性分析等方法可以制定最佳策略。
数据库仓库与数据集的概念介绍
2.1 数据仓库
定义: 企业级所有层级决策支持的数据集合。
功能:提供业务智能以指导流程改进和监控时间、成本、质量和控制。
特征:
- 面向主题的集成性和稳定性;
- 时间变化性,即存储的历史信息随时间推移而发生变化。
2.2 数据集
定义: 一种由数据组成的集合体,通常表现为表格形式。
特点:每一列代表特定变量;每一行对应一个对象的数据。
3 数据仓库
3.1 设计
3.1.1 概念模型设计
完成星型和雪花结构的设计。传统数据库仅适用于商品、销售和客户主题的分析,不适合数据仓库存储。
3.1.2 逻辑模型设计
包括分析业务需求,确定要加载的主题域;定义关系模式等。
3.2 建立
数据集市:特定部门决策支持的应用系统。通常采用多维数据库技术以提高查询速度和效率。
维表建立:
- 多维度视图创建通过包含度量与维度的表格实现,星型模型由小尺寸维表以及大事实表构成;
- 雪花模型中将维信息进一步分层处理,形成更复杂的结构。
全部评论 (0)


