本书是您纵情享用数据之美的得力助手。作为处理海量数据集的理想工具,Apache Hadoop架构是MapReduce算法的一种开源应用,是Google(谷歌)开创其帝国的重要基石。本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。.
本书完全通过案例学习来展示如何用Hadoop解决特殊问题,它将帮助您:
使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集运行分布式计算..
熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理
洞悉编写MapReduce实际应用程序时常见陷阱和高级特性
设计、构建和管理专用的Hadoop集群或在云上运行Hadoop
使用Pig这种高级的查询语言来处理大规模数据
利用HBase这个Hadoop数据库来处理结构化和半结构化数据
学习Zookeeper,这是一个用于构建分布式系统的协作原语工具箱
如果您拥有海量数据,无论是GB级还是PB级,Hadoop都是完美的选择。本书是这方面最全面的参考。
书中没有透露太多实现架构方面的细节,更多的是从使用者的角度上介绍了Hadoop的各种知识,包括MapReduce, HDFS, Hive, Pig, HBase, ZooKeeper。几乎涉及了Hadoop的所有关于使用方面的知识,包括安装和使用。 你甚至可以直接在自己的电脑上装上一个Hadoop,对着书中的例子实际演...
评分看了几章中文版的,各种错误,太低级,实在是看不下去了。 建议还是看原版吧。 译者们的脸皮可真厚,英文译不明白也就罢了,中文都组织的不通顺,好意思吗!! 什么叫 “但是,......,但是”啊,“但是体”啊。
评分买了第一版,时间太紧,没来得及看,后来出了个号称修订升级的第二版,毫不犹豫又买了,后来听说第二版比第一版翻译得好,心中窃喜,再后来看了第二版,我震惊了,我TM就是一傻子,放着好好的英文版不看,赶什么时髦买中文版呢。在这个神奇的国度,牛奶里放的是三聚氰胺,火腿...
评分 评分很好的Hadoop教程,比Apache和Yahoo !网页版guide详细很多,很多想不明白的Hadoop实现细节都可以在这本书里找到。
作为在国内很少能见到的hadoop书籍之一,学习hadoop是必读的。
评分翻译 的很烂,随便翻了翻一些。
评分只看了关于MapReduce和HDFS的部分,翻译的很是粗糙,其实如果只是想了解基本原理和架构的话,看看Google关于MapReduce、GFS和BigTable的论文就可以了。这本书中实践性的东西太多了,关于理论的部分反而显得弱了。
评分了解下hadoop系列的架构和原理
评分自学研究Hadoop的第一本教材
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2026 book.quotespace.org All Rights Reserved. 小美书屋 版权所有