MapReduce 2.0源碼分析與編程實戰

MapReduce 2.0源碼分析與編程實戰 pdf epub mobi txt 電子書 下載2025

出版者:人民郵電齣版社
作者:王曉華
出品人:
頁數:289
译者:
出版時間:2014-1-1
價格:49
裝幀:平裝
isbn號碼:9787115332370
叢書系列:
圖書標籤:
  • Hadoop
  • 源碼閱讀
  • 分布式
  • 計算機
  • 係統設計
  • 架構設計
  • 大數據
  • 圖書館
  • MapReduce
  • Hadoop
  • 大數據
  • 分布式計算
  • 源碼分析
  • 編程實戰
  • 數據處理
  • Java
  • 算法
  • 集群計算
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

Hadoop是一種分布式數據和計算的框架,在大數據處理中應用非常廣泛。MapReduce是一種編程模型。Hadoop正是以MapReduce作為核心編程模型的。  《MapReduce 2.0源碼分析與編程實戰》比較係統地介紹瞭新一代MapReduce 2.0的理論體係、架構和程序設計方法。全書分為10章,係統地介紹瞭HDFS存儲係統,Hadoop的文件I/O係統,MapReduce 2.0的框架結構和源碼分析,MapReduce 2.0的配置與測試,MapReduce 2.0運行流程,MapReduce 2.0高級程序設計以及相關特性等內容。《MapReduce 2.0源碼分析與編程實戰》最後部分介紹瞭數據挖掘的初步知識,以及不同應用類型的MapReduce 2.0編程實戰。  《MapReduce 2.0源碼分析與編程實戰》強調理論聯係實際,幫助讀者在掌握MapReduce 2.0基本知識和特性的基礎上,培養實際編程和解決大數據處理相關問題的能力。《MapReduce 2.0源碼分析與編程實戰》可作為學習MapReduce 2.0的源碼、MapReduce 2.0程序設計、數據挖掘、機器學習等相關內容的程序設計人員的培訓和自學讀物,也可以作為高等院校相關專業的教學輔導書。

著者簡介

王曉華,高校資深計算機專業講師,給研究生和本科生講授麵嚮對象程序設計、數據結構、Hadoop程序設計等相關課程。主要研究方嚮為雲計算、數據挖掘。曾主持和參與多項國傢和省級科研課題,獨立完成一項科研成果獲省級成果認定,發錶過多篇論文,申請一項專利。

圖書目錄

第1章 大象也會跳舞
1.1 大數據時代
1.2 大數據分析時代
1.3 簡單、粗暴、有效這就是Hadoop
1.4 MapReduce與Hadoop
1.5 看,大象也會跳舞
本章小結
第2章 大象的肚子HDFS文件係統詳解
2.1 HDFS基礎詳解
2.1.1 HDFS設計思路
2.1.2 HDFS架構與基本存儲單元
2.2 HDFS數據存取流程分析
2.2.1 HDFS數據存儲位置與復製詳解
2.2.2 HDFS 輸入流程分析
2.2.3 HDFS輸齣流程分析
2.3 HDFS命令行操作詳解
2.3.1 HDFS中4個通用的命令行操作
2.3.2 HDFS文件18個基本命令行的操作
2.3.3 HDFS文件訪問權限詳解
2.4 通過Web瀏覽HDFS文件
2.5 HDFS接口使用詳解
2.5.1 使用FileSystem API操作HDFS中的內容
2.5.2 使用FileSystem API讀取數據詳解
2.5.3 使用FileSystem API寫入數據詳解
2.6 HDFS文件同步與並發訪問
本章小結
第3章 “吃下去吐齣來”Hadoop文件I/O係統詳解
3.1 Hadoop的壓縮類型介紹
3.2 Hadoop的壓縮類庫
3.2.1 從一個簡單的例子開始
3.2.2 CompressionCodec接口
3.2.3 CompressionCodecFactory類詳解
3.2.4 壓縮池
3.2.5 在Hadoop中使用壓縮
3.3 I/O中序列化類型詳解
3.3.1 Text類詳解
3.3.2 IntWritable類詳解
3.3.3 ObjectWritable類詳解
3.3.4 NullWritable類詳解
3.3.5 ByteWritable類詳解
3.4 實現自定義的Writable類型
3.4.1 Writable接口
3.4.2 WritableComparable接口與RawComparator接口
3.4.3 自定義的Writable類
3.4.4 為瞭更快的比較
3.5 Hadoop中小文件處理詳解
3.5.1 SequenceFile詳解
3.5.2 MapFile詳解
本章小結
第4章 “大象的大腦”MapReduce框架結構與源碼分析
4.1 MapReduce框架結構與源碼分析
4.1.1 MapReduce框架分析與執行過程詳解
4.1.2 MapReduce輸入輸齣與源碼分析
4.1.3 MapReduce中Job類詳解
4.2 編程實戰:經典的MapReduce單詞計數程序
4.2.1 準備工作
4.2.2  MapReduce過程分析
4.2.3 計數程序的MapReduce實現
4.2.4 計數程序的main方法
4.2.5 注意事項
4.2.6 運行結果
4.2.7 Mapper中的Combiner詳解
本章小結
第5章 深入!MapReduce配置與測試
5.1 MapReduce環境變量配置詳解
5.1.1 使用XML配置新的配置文件
5.1.2 修改已有的配置文件
5.1.3 輔助類ToolRunner、Configured詳解
5.2 使用MRUnit對MapReduce進行測試
5.2.1 MRUnit簡介與使用
5.2.2 使用MRUnit完成Mapper單元測試
5.2.3 使用MRUnit完成Reduce單元測試
5.2.4 使用MRUnit完成MapReduce單元測試
5.3 在本地磁盤上進行MapReduce測試
5.3.1 僞環境欺騙
5.3.2 在Eclipse中配置Hadoop插件
5.3.3 編寫本地測試代碼
5.4 MapReduce計數器
5.4.1 使用計數器的MapReduce程序設計
5.4.2 通過Web接口進行任務分析
5.4.3 通過Web接口查看計數器
本章小結
第6章 大象的思考流程MapReduce運行流程詳解
6.1 經典MapReduce任務的工作流程
6.1.1 ClientNode執行任務的初始化
6.1.2 消息傳遞
6.1.3 MapReduce任務的執行
6.1.4 任務的完成與狀態更新
6.2 經典MapReduce任務異常處理詳解
6.2.1 MapReduce任務異常的處理方式
6.2.2 MapReduce任務失敗的處理方式
6.3 經典MapReduce任務的數據處理過程
6.3.1 Map端的輸入數據處理過程
6.3.2 Reduce端的輸入數據處理過程
6.3.3 Java虛擬機重用
6.4 MapReduce 2.0(YARN)工作流程詳解
6.4.1 YARN概述
6.4.2 YARN任務過程分析
6.4.3 YARN的異常處理
本章小結
第7章 更強的大象MapReduce高級程序設計續
7.1 MapReduce程序設計默認格式類型詳解
7.1.1 map與reduce方法的默認輸入輸齣類型
7.1.2 自定義輸入輸齣類型設置
7.1.3 自定義全局類型變量設置要求
7.1.4 默認的MapReduce程序設置
7.2 InputFormat輸入格式詳解
7.2.1 輸入記錄與分區
7.2.2 InputFormat源碼及執行過程分析
7.2.3 實現自己的RecordReader類
7.2.4 自定義的FileInputFormat類
7.2.5 一些常用的InputFormat類詳解
7.3 OutputFormat輸齣格式詳解
7.3.1 OutputFormat默認輸齣格式
7.3.2 自定義OutputFormat輸齣格式
7.3.3 對Reduce任務數進行設置
7.3.4 OutputFormat分區類Partitioner詳解
7.4 多種輸入與輸齣使用介紹
7.4.1 MultipleInputs多種輸入方式詳解
7.4.2 MultipleOutputs多種輸齣方式詳解
本章小結
第8章 MapReduce相關特性詳解
8.1 MapReduce計數器
8.1.1 Hadoop框架內置的計數器
8.1.2 自定義計數器
8.1.3 動態計數器
8.1.4 獲取計數器值
8.2 排序與查找
8.2.1 普通排序規則與查找
8.2.2 使用MapFile進行排序與查找
8.3 對輸齣結果的值分組排序
8.3.1 準備工作
8.3.2 對結果進行分組處理
8.3.3 對鍵的二次排序
8.3.4 自定義輸齣分組
8.4 編程實戰:使用二次排序自動查找最小值
8.4.1 思路分析
8.4.2 驗證輸入輸齣結果
8.4.3 對結果進行二次排序
8.4.4 對結果進行分組
8.4.5 分片處理排序與分組
8.4.6 驗證結果
本章小結
第9章 啤酒與尿布MapReduce連接與數據挖掘初步
9.1 對於同樣格式數據進行MapReduce連接
9.2 對於不同格式數據進行MapReduce連接
9.3 不能說的秘密啤酒與尿布
9.3.1 銷售清單的秘密
9.3.2 設計程序
9.3.3 程序執行結果
9.4 數據挖掘初步
本章小結
第10章 MapReduce實戰編程及深度分析
10.1 編程實戰:自定義數據庫中讀取數據
10.1.1 準備工作
10.1.2 程序分析
10.1.3 自定義SQLInputFormat
10.1.4 使用自定義程序從數據庫中讀取數據
10.1.5 程序運行及數據分析
10.1.6 使用閤並記錄進行性能調優
10.2 編程實戰:串聯尋找共同轉載微博
10.2.1 應用分析
10.2.2 第一步錶轉換
10.2.3 建立關注連接
10.2.4 自定義的OutputFormat
10.2.5 串聯解決共同轉載微博
10.2.6 性能調優及後續處理
10.3 編程實戰:雲存儲模型
10.3.1 應用分析
10.3.2 Tomcat簡介
10.3.3 配置Tomcat服務器
10.3.4 測試Tomcat服務器
10.3.5 在Eclipse中配置Tomcat
10.3.6 創建雲存儲目錄
10.3.7 獲取雲存儲列錶
10.3.8 將文件上傳至數據雲存儲中
10.3.9 刪除文件
10.3.10 下載雲端存儲文件
10.3.11 程序執行與性能調優
10.4 編程實戰:多文檔相似關鍵字檢索
10.4.1 應用分析
10.4.2 自定義任務處理類
10.4.3 程序執行及後續分析
10.5 編程實戰:學生成績整理與分組
10.5.1 應用分析
10.5.2 自定義的ScoreWritable
10.5.3 自定義的MapReduce
10.5.4 自定義的分組
10.5.5 程序運行結果
10.5.6 采用更多分組類型
本章小結
· · · · · · (收起)

讀後感

評分

評分

評分

評分

評分

用戶評價

评分

真的是一本被低估的好書,版本新,案例足,適閤初學者

评分

可以上手寫 mapreduce use case 瞭

评分

個人感覺這本書使我對mapreduce理解的更好瞭,想多於權威指南,更有側重點,程序更加的明白,相對於理論,本書更加側重一點應用層麵,權威指南之後可以讀讀。

评分

個人感覺這本書使我對mapreduce理解的更好瞭,想多於權威指南,更有側重點,程序更加的明白,相對於理論,本書更加側重一點應用層麵,權威指南之後可以讀讀。

评分

感覺這也算是本被埋沒的好書瞭。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有