
Kaggle: tmdb-box-office-prediction(转换为结构化数据以供SQL练习)
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本项目基于Kaggle的TMDB电影票房预测竞赛,将原始数据整理成适合SQL查询的形式,便于进行数据分析和模型训练。
原数据源(将其训练集结构化):
https://www.kaggle.com/ctmdb-box-office-prediction/data
数据量级及建表语句(含字段含义注释)详见相关博客。
共15个表:
- movies:电影表,记录了电影的基本信息。
- belongs_to_collection:电影系列表,展示各部影片是否属于某个系列及其所属的序列编号等详细情况。
- person:人员表(演员与剧组成员),包括各个参与制作和表演的人士的相关资料。
- cast_rela:电影与演员关联表,记录了具体某一部影片中所有主演及客串明星的信息链接关系。
- crew_rela:电影与剧组人员的关联表,列出了负责该片导演、编剧等核心职位工作人员的具体情况及其参与的作品信息连接。
- genres:电影体裁表,定义了各种不同的类型和风格分类标准。
- genres_rela:电影与体裁关联表,记录每部影片所归属的各种不同类别的详细对应关系。
- keywords:电影关键词表,汇总了一批描述性词汇用于概括各片内容特色或主题思想等信息点的集合。
- keywords_rela:电影与关键词关联表,表示各个特定术语、短语与其相关联的具体作品之间的联系纽带。
- production_companies:电影制作公司表,列出了所有参与影片创作发行的企业名单及其基本信息。
- production_companies_rela:电影与制作公司关联表,详细记录了每部片子背后支持的所有出品单位及各自承担的角色分工情况。
全部评论 (0)
还没有任何评论哟~


