
由于数据工程项目相对较少,涵盖数据建模和云基础设施配置等内容。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
数据工程项目一:利用Postgres进行数据建模,在该项目中,我们融合了数据建模与Postgres数据库技术的结合,并借助Python开发了高效的ETL流程。 一家新兴企业致力于深入分析其全新音乐流应用程序中收集到的关于歌曲及用户行为的相关数据。目前,他们采用JSON格式存储这些数据,分析团队尤其关注如何洞察用户正在聆听的歌曲类型。 链接:
数据工程项目二:借助Cassandra进行数据建模,在这个项目中,我们将数据建模策略与Cassandra数据库系统相结合,同时运用Python构建了相应的ETL管道。 我们将围绕需要查询的关键问题来设计和构建数据模型。 为了满足我们的具体应用场景,我们需要以下信息: 详细检索特定会话期间在音乐应用程序历史记录中出现的歌曲信息; 获取用户在音乐应用程序特定会话期间播放的歌曲列表; 从音乐应用程序历史记录中识别所有听过特定歌曲的用户群体。 链接:
数据工程项目三:构建数据仓库,在此项目中,我们将应用所学的数据仓库架构原则,并在Amazon Web Services(AWS)云平台上搭建一个完整的、可扩展的数据仓库环境。 我们设计并实施了一个ETL管道系统,用于从Amazon S3存储桶中提取以JSON格式存储的数据,并将其迁移至Amazon Redshift托管的仓库中进行存储和处理。 使用Redshift I.
全部评论 (0)
还没有任何评论哟~


