图书标签: Spark 大数据 分布式 spark O'Reilly 编程 计算机科学 数据平台
发表于2024-11-24
Spark pdf epub mobi txt 电子书 下载 2024
Learn how to use, deploy, and maintain Apache Spark with this comprehensive guide, written by the creators of the open-source cluster-computing framework. With an emphasis on improvements and new features in Spark 2.0, authors Bill Chambers and Matei Zaharia break down Spark topics into distinct sections, each with unique goals.
You’ll explore the basic operations and common functions of Spark’s structured APIs, as well as Structured Streaming, a new high-level API for building end-to-end streaming applications. Developers and system administrators will learn the fundamentals of monitoring, tuning, and debugging Spark, and explore machine learning techniques and scenarios for employing MLlib, Spark’s scalable machine-learning library.
这本书可以解释 Spark 可以做什么,但不能解释 Spark 是怎么做的,更多的细节还需要借助其他资料
评分作为spark入门书非常适合,每个部分讲解得十分透彻。请书中使用的是Spark 2.3这已经是目前最新的一个版本。基本没有落后太多。每一个实例的编写都会使用Scala和Python两种语言来编写。这不仅适合大部分程序员,同时也适合数据分析师。
评分应该是最合适的spark入门读物,且有python代码,对scala新手也很友好
评分适合刷一遍快速上手~~进阶还是多读几遍High Performance Spark吧~~
评分以前了解过一些分布式、大数据相关的概念,但都没有太多的实践机会,所以了解的也不系统和深入。读了前面4章感觉写得真是清楚,并且还会讲一些原理,然后了解各种概念,适合入门级别吧。
评分
评分
评分
评分
Spark pdf epub mobi txt 电子书 下载 2024