Hadoop MapReduce性能優化

Hadoop MapReduce性能優化 pdf epub mobi txt 電子書 下載2025

出版者:人民郵電齣版社
作者:[法]卡勒德•坦尼爾(Khaled Tannir)
出品人:
頁數:90
译者:範歡動
出版時間:2015-3
價格:35.00
裝幀:
isbn號碼:9787115381279
叢書系列:
圖書標籤:
  • Hadoop
  • 編程
  • 程序設計
  • 性能優化
  • 性能
  • 大數據
  • MapReduce
  • Hadoop
  • MapReduce
  • 性能優化
  • 大數據
  • 分布式計算
  • 數據處理
  • 集群
  • 調優
  • JVM
  • 內存管理
  • IO優化
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

大數據時代,MapReduce的重要性不言而喻。Hadoop作為MapReduce框架的一個實現,受到業界廣泛的認同,並被廣泛部署和應用。盡管Hadoop為數據開發工程師入門和編程提供瞭極大便利,但構造一個真正滿足性能要求的MapReduce程序並不簡單。數據量巨大是大數據工作的現實問題,而對低響應時間的要求則時常睏擾著數據開發工程師。

本書采用原理與實踐相結閤的方式,通過原理講解影響MapReduce性能的因素,透過實例一步步地教讀者如何發現性能瓶頸並消除瓶頸,如何識彆係統薄弱環節並改善薄弱環節,講解過程中融閤瞭作者在優化實踐過程中積纍的豐富經驗,具有很強的針對性。讀完本書,能讓讀者對Hadoop具有更強的駕馭能力,從而構造齣性能最優的MapReduce程序。

Hadoop性能問題既是程序層麵的問題,也是係統層麵的問題。本書既覆蓋瞭係統層麵的優化又覆蓋瞭程序層麵的優化,非常適閤Hadoop管理員和有經驗的數據開發工程師閱讀。對於初學者,本書第1章也作瞭必要的技術鋪墊,避免對後麵章節的理解産生梯度。

著者簡介

作者介紹

Khaled Tannirhas從1980年開始從事計算機相關工作。他是微軟認證的開發人員(MCSD),他在領導軟件解決方案的開發和實施以及技術演說方麵,擁有20多年技術經驗。如今,他是一名獨立IT谘詢師,並在法國、加拿大的許多大公司擔任基礎設施工程師、高級研發工程師、企業/解決方案架構師等職務。

他在Microsoft .NET、Microsoft服務器係統、Oracle Java技術等領域擁有豐富的經驗,並且熟練駕馭在綫和離綫應用係統設計、係統轉換以及多語言的互聯網/桌麵應用程序開發。

Khaled Tnnirhas總是熱衷於探索和學習新的技術,並基於這些技術在法國、北美、中東等地區尋求商機。他現在擁有一個IT電子實驗室,實驗室中配備瞭很多服務器、監控器、開源電子闆(如Arduino、Netduino、RaspBerry Pi和.Net Gadgeteer),還有一些裝有Windows Phone、Android和iOS操作係統的智能設備。

2012年,他協助組織並齣席瞭法國波爾多大學的復雜數據挖掘國際論壇——EGC 2012。

他還是《RavenDB 2.x Beginner’s Guide》一書的作者。

譯者簡介

範歡動 信息技術領域的一名老兵。1994年獲得電力係統及其自動化專業學士學位。1997年獲得信號與信息處理專業碩士學位。興趣廣泛,涉及技術領域和非技術領域,但大多淺嘗輒止。參與過航天、通信、電子齣版和金融領域的信息處理、軟件架構與開發,以第一作者或閤作者身份擁有三項實用新型專利,並獲得第十八屆北京市優秀青年工程師稱號。曾在佳訊飛鴻電氣股份有限公司、英國雅訊(xarios)北京代錶處、博雲科技等公司擔任産品技術總監。目前,終於把全部的興趣聚焦到瞭數據分析,尤其是大數據分析上,主要目標是利用數據分析手段發現模式,從而降低決策風險、改善産業價值鏈。冀望在大數據時代與讀者一起學習並分享大數據相關技術,共同發掘大數據帶來的價值。

圖書目錄

目錄
第1章 瞭解Hadoop MapReduce 1
1.1 MapReduce模型 1
1.2 Hadoop MapReduce概述 3
1.3 Hadoop MapReduce的工作原理 4
1.4 影響MapReduce性能的因素 5
1.5 小結 8
第2章 Hadoop參數概述 9
2.1 研究Hadoop參數 9
2.1.1 配置文件mapred-site.xml 10
2.1.2 配置文件hdfs-site.xml 15
2.1.3 配置文件core-site.xml 18
2.2 Hadoop MapReduce性能指標 19
2.3 性能監測工具 20
2.3.1 用Chukwa監測Hadoop 21
2.3.2 使用Ganglia監測Hadoop 21
2.3.3 使用Nagios監測Hadoop 21
2.4 用Apache Ambari監測Hadoop 22
2.5 小結 23
第3章 檢測係統瓶頸 25
3.1 性能調優 25
3.2 創建性能基綫 27
3.3 識彆資源瓶頸 30
3.3.1 識彆內存瓶頸 30
3.3.2 識彆CPU瓶頸 31
3.3.3 識彆存儲瓶頸 32
3.3.4 識彆網絡帶寬瓶頸 33
3.4 小結 34
第4章 識彆資源薄弱環節 35
4.1 識彆集群薄弱環節 35
4.1.1 檢查Hadoop集群節點的健康狀況 36
4.1.2 檢查輸入數據大小 37
4.1.3 檢查海量I/O和網絡阻塞 38
4.1.4 檢查並發任務不足 39
4.1.5 檢查CPU過飽和 40
4.2 量化Hadoop集群 41
4.3 正確配置集群 44
4.4 小結 47
第5章 強化map和reduce任務 49
5.1 強化map任務 49
5.1.1 輸入數據和塊大小的影響 51
5.1.2 處置小文件和不可拆分文件 51
5.1.3 在Map階段壓縮溢寫記錄 53
5.1.4 計算map任務的吞吐量 55
5.2 強化reduce任務 57
5.2.1 計算reduce任務的吞吐量 58
5.2.2 改善Reduce執行階段 59
5.3 調優map和reduce參數 60
5.4 小結 64
第6章 優化MapReduce任務 65
6.1 使用Combiner 65
6.2 使用壓縮技術 68
6.3 使用正確Writable類型 72
6.4 明智地復用類型 74
6.5 優化mapper和reducer的代碼 76
6.6 小結 78
第7章 最佳實踐與建議 81
7.1 硬件調優與操作係統推薦 81
7.1.1 Hadoop集群檢查錶 81
7.1.2 Bios調優檢查錶 82
7.1.3 OS配置建議 82
7.2 Hadoop最佳實踐與建議 83
7.2.1 部署Hadoop 83
7.2.2 Hadoop調優建議 84
7.2.3 使用MapReduce模闆類代碼 86
7.3 小結 90
· · · · · · (收起)

讀後感

評分

評分

評分

評分

評分

用戶評價

评分

雖然是講的Hadoop1,不過仍舊給我一些啓發。從mapreduce的每個階段去分析和優化是一個很好的方法

评分

一本隻有90頁小冊子,能獲得一些啓發。

评分

雖然是講的Hadoop1,不過仍舊給我一些啓發。從mapreduce的每個階段去分析和優化是一個很好的方法

评分

一本隻有90頁小冊子,能獲得一些啓發。

评分

雖然是講的Hadoop1,不過仍舊給我一些啓發。從mapreduce的每個階段去分析和優化是一個很好的方法

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有