圖書標籤: hadoop 分布式 雲計算 mapreduce Hadoop權威指南 計算機 大數據 O'Reilly
发表于2025-02-02
Hadoop權威指南(中文版) pdf epub mobi txt 電子書 下載 2025
本書是您縱情享用數據之美的得力助手。作為處理海量數據集的理想工具,Apache Hadoop架構是MapReduce算法的一種開源應用,是Google(榖歌)開創其帝國的重要基石。本書內容豐富,展示瞭如何使用Hadoop構建可靠、可伸縮的分布式係統,程序員可從中探索如何分析海量數據集,管理員可以瞭解如何建立與運行Hadoop集群。.
本書完全通過案例學習來展示如何用Hadoop解決特殊問題,它將幫助您:
使用Hadoop分布式文件係統(HDFS)來存儲海量數據集,通過MapReduce對這些數據集運行分布式計算..
熟悉Hadoop的數據和I/O構件,用於壓縮、數據集成、序列化和持久處理
洞悉編寫MapReduce實際應用程序時常見陷阱和高級特性
設計、構建和管理專用的Hadoop集群或在雲上運行Hadoop
使用Pig這種高級的查詢語言來處理大規模數據
利用HBase這個Hadoop數據庫來處理結構化和半結構化數據
學習Zookeeper,這是一個用於構建分布式係統的協作原語工具箱
如果您擁有海量數據,無論是GB級還是PB級,Hadoop都是完美的選擇。本書是這方麵最全麵的參考。
學一學
評分翻譯爛加上過時瞭
評分隻看瞭關於MapReduce和HDFS的部分,翻譯的很是粗糙,其實如果隻是想瞭解基本原理和架構的話,看看Google關於MapReduce、GFS和BigTable的論文就可以瞭。這本書中實踐性的東西太多瞭,關於理論的部分反而顯得弱瞭。
評分內容應該給四星半,但是翻譯以及排版上的錯誤百齣啊
評分沒完全看明白 預習一下
其实也不算全部读完了,读它主要是为了技术选型,考虑升级持久层架构、提高系统可扩展性,仔细研读了前几章,对Hadoop、MapReduce、HDFS的模型、机制、使用场景有了一定了解。后面几章及其生态圈内的其他项目抱着了解的心态简单浏览了一下。整体感觉还行,至少从我看过的章节来...
評分你的履历添了一笔<hadoop权威指南>译者,但是你不配 这是我见过的最不用心的翻译, 字里行间行文不通顺, 请别勉强自己,map reduce shuffle机制都没翻译的好 虽然原作者写作功底也实在是一般 第 1 2 5 6 7 这几章 翻译的实在是太烂了 请不要呐Google翻译糊弄人阿 误人子弟 ...
評分中文版412页: 所以理论上,任何东西都可以表示成二进制形式,然后转化成为长整型的字符串或直接对数据结构进行序列化,来作为键值。 原文460页: ..., so theoretically anything can serve as row key, from strings to binary representations of long or even serialized ...
評分专门登录来评论的,翻译也太烂了吧,真的真的建议强烈英语阅读能力好的人去读原版书,不要花冤枉钱在这上面,除了文字错误外,里边的图居然也有错,就比如260页的图最后两个年份应该是1901结果这里竟然是1900,我是真滴服了,一本神书被翻译成这样,作者得气死。zsbd zsbd zsbd...
Hadoop權威指南(中文版) pdf epub mobi txt 電子書 下載 2025