【编辑推荐】
从实用角度系统讲解Spark的数据处理工具及使用方法
手把手教你充分利用Spark提供的各种功能,快速编写高效分布式程序
【内容简介】
Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等各大公司等。
本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。
【作者简介】
Holden Karau 资深软件开发工程师,现就职于Databricks公司,之前曾就职于谷歌、亚马逊、微软和Foursquare等著名公司。他对开源情有独钟,参与了许多开源项目,如Linux内核无线驱动、Android程序监控、搜索引擎等,对存储系统、推荐系统、搜索分类等都有深入研究。
【译者简介】
余璜 阿里巴巴核心系统研发工程师,OceanBase核心开发人员,对分布式系统理论和工程实践有深刻理解,专注于分布式系统设计、大规模数据处理,乐于分享,在CSDN上分享了大量技术文章。
张磊 Spark爱好者,曾参与分布式OLAP数据库系统核心开发,热衷于大数据处理、分布式计算。
饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。
评分饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。
评分饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。
评分饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。
评分饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。
这书:薄、没实质性内容、spark版本太老,一句话不值得买,甚至不值得看。
评分翻译太差,不如看doc
评分现在看这本书写的已经比较早了 有些东西看着似乎不是这样了 而且写的特别简单 这本书未必值得一读
评分快速全面了解一下spark,其实学不到什么东西 2017.2.14
评分垃圾!
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有