Advertisement

Apache Spark设计与实现及源码剖析.pdf + Spark原著中文版.pdf

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本书深入解析了Apache Spark的设计理念、架构原理及其核心源代码,并结合Spark原著进行详细讲解和分析。适合希望深入了解Spark技术细节的专业开发者阅读。 《Apache Spark设计与实现.pdf》、《Apache Spark源码剖析.pdf》以及《Spark原著中文版.pdf》这三本书籍涵盖了从理论到实践的全面内容,适合深入学习Apache Spark的技术细节和应用场景。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Apache Spark.pdf + Spark.pdf
    优质
    本书深入解析了Apache Spark的设计理念、架构原理及其核心源代码,并结合Spark原著进行详细讲解和分析。适合希望深入了解Spark技术细节的专业开发者阅读。 《Apache Spark设计与实现.pdf》、《Apache Spark源码剖析.pdf》以及《Spark原著中文版.pdf》这三本书籍涵盖了从理论到实践的全面内容,适合深入学习Apache Spark的技术细节和应用场景。
  • Apache Spark 2.0.2 档.pdf
    优质
    本PDF文件为Apache Spark 2.0.2版本的官方中文文档,详细介绍了Spark的核心概念、API使用方法及相关配置信息。 ApacheCN 提供了 Apache Spark 2.0.2 的中文文档版本,当前版本为 v0.1.0。
  • Spark SQL案例
    优质
    《Spark SQL案例剖析》一书深入探讨了Apache Spark SQL的核心概念、执行原理及优化技巧,并通过丰富的实战案例,帮助读者掌握高效的数据分析与处理方法。 针对航班数据下载过程中遇到的问题进行分析,并逐步写出相应的Spark SQL解决方案。
  • Spark官方本.pdf
    优质
    《Spark官方文档中文版本》为用户提供全面详细的Apache Spark技术指南和API参考,支持大数据处理与分析任务,方便国内开发者学习使用。 spark官方文档中文版.pdf
  • Spark MLlib(下)——Spark MLlib 战.pdf
    优质
    本PDF文件深入讲解了Apache Spark的MLlib库的应用实践,通过实例解析如何利用MLlib进行大规模数据集上的机器学习任务。 1. Spark及其生态圈简介 2. Spark编译与部署(上)——基础环境搭建 3. Spark编译与部署(下)——Spark编译安装 4. Spark编译与部署(中)——Hadoop编译安装 5. Spark编程模型(上)——概念及SparkShell实战 6. Spark编程模型(下)——IDEA搭建及实战 7. Spark运行架构 8. Hive(上)——Hive介绍及部署 9. Hive(下)——Hive实战 10. SparkSQL(上)——SparkSQL简介 11. SparkSQL(下)——Spark实战应用 12. SparkSQL(中)——深入了解运行计划及调优 13. SparkStreaming(上)——SparkStreaming原理介绍 14. SparkStreaming(下)——SparkStreaming实战 15. SparkMLlib(上)——机器学习及SparkMLlib简介 16. SparkMLlib(下)——SparkMLlib实战 17. SparkGraphX介绍及实例 18. 分布式内存文件系统Tachyon介绍及安装部署
  • Spark Python KNN:在Apache Spark算K-NN的函数
    优质
    本文章介绍了如何使用Python在Apache Spark平台上实现K-Nearest Neighbors (K-NN)算法,并提供了详细的函数说明和示例代码,帮助用户高效地处理大规模数据集。 Spark Python K-nn 提供了一个简单且存储效率高的函数来计算K个最近的邻居。此功能需要安装Numpy 和 scikit-learn 库,并将 jakac:spark-python-knn:0.0.3 添加到您的应用程序要求中。 使用方法如下: ```python from gaussalgo.knn import compute_neighbors import numpy as np left = sc.parallelize([ (1, np.array([0,0,1,1])), (2, np.array([0,1,1,1])), (3, np.array([0,0,1,1])), (4, np.array([...])) ```
  • 肖睿的HadoopSpark PDF
    优质
    《肖睿的Hadoop与Spark》PDF版是一本深入浅出地讲解大数据处理技术Hadoop和Spark原理及应用的专业书籍,适合数据工程师和技术爱好者学习参考。 大数据技术使我们能够以前所未有的方式分析海量数据,并从中获取具有重大价值的产品和服务,从而推动变革的发生。本书主要讲解Hadoop和Spark两个主流的大数据技术,涵盖了Hadoop环境配置、分布式文件系统(HDFS)、MapReduce计算框架、资源调度框架YARN与新特性、分布式数据库HBase、数据仓库Hive、大数据离线处理辅助系统以及Spark Core、SQL查询引擎和流式处理等知识。本书紧密结合实际应用需求,并通过大量案例说明及实践操作,提炼出宝贵的开发经验。此外,还提供了丰富的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区与讨论组等内容,为读者提供全方位的学习体验。
  • 操作系统(Tanenbaum.pdf
    优质
    本书为《操作系统:设计与实现》的中文版本,作者是Andrew S. Tanenbaum。书中详细介绍了微型计算机操作系统MINIX的设计理念、内部结构和实现方法,适合对操作系统感兴趣的读者学习参考。 《操作系统设计与实现》是由Andrew S. Tanenbaum编写的中文版书籍,该书详细介绍了操作系统的原理及其实践方法,并通过实例帮助读者深入理解相关概念和技术细节。书中不仅涵盖了理论知识,还提供了大量的实验指导,使学习者能够更好地掌握实际应用技能。
  • Spark战指南.pdf
    优质
    《Spark实战指南》是一本深入浅出介绍Apache Spark大数据处理技术的应用书籍,适合数据工程师与分析师阅读,帮助读者掌握高效的数据分析和挖掘技能。 Apache Spark 是一个通用的数据处理框架,适用于各种计算任务。因此,任何关于 Apache Spark 的书籍都需要涵盖许多不同的主题。我们试图全面描述如何使用 Spark:从配置运行时选项、执行独立或交互式作业到编写批处理、流处理或机器学习应用程序。我们也尽量挑选一些可以在个人电脑上运行的示例和数据集,并确保这些例子易于理解且能很好地说明概念。希望这本书及其示例能够帮助你理解和运行 Spark,从而有助于你开发未来的生产级Spark应用。
  • 透彻掌握Spark:核心理念.pdf
    优质
    本书深入剖析了Apache Spark的核心设计理念及其实现细节,通过详细的源代码解析帮助读者全面理解Spark的工作原理和架构特点。 深入理解Spark:核心思想及源码分析.pdf讲述了Spark的核心理念及其源代码的详细解析。