
Practical Hadoop Migration (Apress, 2016)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
《Practical Hadoop Migration》由Apress出版社于2016年出版,本书为读者提供了将数据迁移至Hadoop平台的实际操作指南和技术细节。
本书介绍了将关系型应用程序重构为NoSQL架构、整合关系数据库管理系统与Hadoop生态系统以及在Hadoop组件间转换迁移关系数据的最佳实践设计方法。通过优化并发性、安全性、反范式化及性能,可帮助读者提升应用效率。
作者Bhushan Lakhe曾荣获IBM 2012年Gerstner奖,并著有《实用Hadoop安全》一书,在本书中详细介绍了整个转换过程。首先,他阐述了决定重构、迁移和整合关系型数据库与HDFS之间最佳方案的标准。然后展示了如何设计过渡模型。
书中还涵盖了ETL工具的选择标准、使用SQOOP及Flume进行数据传输的实施步骤以及通过分区调整、调度聚合和重新设计ETL来优化转换的技术方法。此外,作者评估了Lambda架构和数据湖作为集成解决方案的优势与劣势,并结合实际案例进行了说明。
Hadoop/NoSQL方案默认情况下不提供关系型技术的一些特性,如基于角色访问控制、并发更新的锁定以及用于测量并增强性能的各种工具。《实用Hadoop迁移》一书则展示了如何使用开源工具在Hadoop生态系统组件中模拟这些功能。
通过本书的学习,读者将掌握以下内容:
- 关系数据与NoSQL模型的设计需求及方法;
- 如何判断是否应将关系型应用程序迁移到大数据技术或与其整合;
- 如何从逻辑设计和物理实施角度转换关系应用到Hadoop/NoSQL平台;
- RDBMS至HDFS的集成、数据变换和优化技巧;
- 何时考虑使用Lambda架构与数据湖解决方案;
- 如何选择并实现基于Hadoop的应用组件,以加速过渡过程,优化整合性能,并模拟关系功能。
全部评论 (0)


