
PDM: 基于Hadoop的并行数据处理系统 (2012年)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
PDM是2012年开发的一款基于Hadoop的高效并行数据处理系统,旨在提供强大的数据存储和计算能力,适用于大规模数据分析场景。
本段落介绍了一款基于Hadoop的并行数据分析系统PDM。该系统包含大量以MapReduce为计算框架的并行数据分析算法,包括传统的ETL、数据挖掘、数据统计和文本分析算法,以及引入了基于图理论的社会网络分析(SNA)算法。文中详细阐述了并行多元线性回归算法和“多源最短路径”算法的工作原理与实现方式,并提出了一种名为“消息传递模型”的方法来解决MapReduce难以处理邻接矩阵的问题。此外,文章还介绍了几个基于电信数据的应用实例:如通过并行k均值和决策树算法进行的套餐推荐服务;以及利用并行PageRank算法发现营销关键点等应用案例。
全部评论 (0)
还没有任何评论哟~


