零基礎學大數據算法

零基礎學大數據算法 pdf epub mobi txt 電子書 下載2025

出版者:電子工業齣版社
作者:王宏誌
出品人:博文視點
頁數:268
译者:
出版時間:2016-7
價格:59.00元
裝幀:平裝
isbn號碼:9787121289378
叢書系列:
圖書標籤:
  • 大數據
  • 算法
  • spark
  • 計算機
  • 科普
  • #數據
  • 大數據
  • 算法
  • 零基礎
  • 編程學習
  • 數據分析
  • 機器學習
  • 數據科學
  • 基礎教程
  • 實戰指導
  • 算法入門
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

《零基礎學大數據算法》是通俗易懂的大數據算法教程。通篇采用師生對話的形式,旨在用通俗的語言、輕鬆的氣氛,幫助讀者理解大數據計算領域中的基礎算法和思想。

《零基礎學大數據算法》由背景篇、理論篇、應用篇和實踐篇四部分組成。背景篇介紹大數據、算法、大數據算法等基本概念和背景;理論篇介紹解決大數據問題的亞綫性算法、磁盤算法、並行算法、眾包算法的基本思想和理論知識;應用篇介紹與大數據問題息息相關的數據挖掘和推薦係統的相關知識;實踐篇從實際應用齣發,引導讀者動手操作,幫助讀者通過實際程序和實驗驗證磁盤算法、並行算法和眾包算法。

在講解每一個大數據問題之前,《零基礎學大數據算法》都會介紹大量的經典算法和基礎數據結構知識,不僅可以幫助學習過數據結構與算法、算法設計與分析等課程的同學復習,同時能夠讓入門的“小菜鳥”們,不會因為沒有學習過經典算法而對《零基礎學大數據算法》望而卻步,輕鬆地掌握大數據算法!

著者簡介

圖書目錄

第1 篇 背景篇
第1 章何謂大數據 ..... 4
1.1身邊的大數據 4
1.2大數據的特點和應用 ............ 6
第2 章何謂算法 ................................ 8
2.1算法的定義 .... 8
2.2算法的分析 .. 14
2.3基礎數據結構——綫性錶 .. 24
2.4遞歸——以階乘為例 .......... 28
第3 章何謂大數據算法 ................... 31
第2 篇 理論篇
第4 章窺一斑而見全豹——亞綫性算法 ............... 34
4.1亞綫性算法的定義 .............. 34
4.2空間亞綫性算法 .................. 35
4.2.1水庫抽樣 .................. 35
4.2.2數據流中的頻繁元素 ...................... 37
4.3時間亞綫性計算算法 ......... 40
4.3.1圖論基礎迴顧 .......... 40
4.3.2平麵圖直徑 .............. 45
4.3.3最小生成樹 .............. 46
4.4時間亞綫性判定算法 .......... 53
4.4.1全0 數組的判定 ...... 53
4.4.2數組有序的判定 ...... 55
第5 章價錢與性能的平衡——磁盤算法 ............... 58
5.1磁盤算法概述 ...................... 58
5.2外排序 ......... 62
5.3外存數據結構——磁盤查找樹 .................. 71
5.3.1二叉搜索樹迴顧 ...... 71
5.3.2外存數據結構——B 樹 ................... 78
5.3.3高維外存查找結構——KD 樹 ....... 80
5.4錶排序 ......... 83
5.5錶排序的應用 ...................... 86
5.5.1歐拉迴路技術 .......... 86
5.5.2父子關係判定 .......... 87
5.5.3前序計數 .................. 88
5.6時間前嚮處理技術 .............. 90
5.7縮圖法 ......... 98
第6 章1+1>2——並行算法 .......... 103
6.1MapReduce 初探 ................ 103
6.2MapReduce 算法實例 ........ 106
6.2.1字數統計 ................ 106
6.2.2平均數計算 ............ 108
6.2.3單詞共現矩陣計算 .111
6.3MapReduce 進階算法 ........ 115
6.3.1join 操作 ................. 115
6.3.2MapReduce 圖算法概述 ................ 122
6.3.3基於路徑的圖算法 125
第7 章超越MapReduce 的並行計算 .................. 131
7.1MapReduce 平颱的局限 .... 131
7.2基於圖處理平颱的並行算法 .................... 136
7.2.1概述 136
7.2.2BSP 模型下的單源最短路徑 ........ 137
7.2.3計算子圖同構 ........ 141
第8 章眾人拾柴火焰高——眾包算法 ................. 144
8.1眾包概述 .... 144
8.1.1眾包的定義 ............ 144
8.1.2眾包應用舉例 ........ 146
8.1.3眾包的特點 ............ 149
8.2眾包算法例析 .................... 152
第3 篇 應用篇
第9 章大數據中有黃金——數據挖掘 ................. 158
9.1數據挖掘概述 .................... 158
9.2數據挖掘的分類 ................ 159
9.3聚類算法——k-means ....... 160
9.4分類算法——Naive Bayes 166
第10 章推薦係統 ... 170
10.1推薦係統概述 .................. 170
10.2基於內容的推薦方法 ...... 173
10.3協同過濾模型 .................. 176
第4 篇實踐篇
第11 章磁盤算法實踐 ................... 186
第12 章並行算法實踐 ................... 194
12.1Hadoop MapReduce 實踐 194
12.1.1環境搭建 .............. 194
12.1.2配置Hadoop ......... 201
12.1.3“Hello World”程序—— WordCount ................. 203
12.1.4Hadoop 實踐案例——記錄去重 . 213
12.1.5Hadoop 實踐案例——等值連接 . 216
12.1.6多機配置 .............. 221
12.2適於迭代並行計算的平颱——Spark ..... 224
12.2.1Spark 初探 ............ 224
12.2.2單詞齣現行計數 .. 230
12.2.3在Spark 上實現WordCount ....... 236
12.2.4在HDFS 上使用Spark ................ 241
12.2.5Spark 的核心操作——Transformation 和Action ...................... 244
12.2.6Spark 實踐案例——PageRank .... 247
第13 章眾包算法實踐 ................... 251
13.1認識AMT . 251
13.2成為眾包工人 .................. 252
· · · · · · (收起)

讀後感

評分

評分

評分

評分

評分

用戶評價

评分

概念介紹……

评分

粗略看瞭一遍,沒有特彆深的感悟,也沒留下清晰的印象和知識架構。舉的例子還行,淺入淺齣吧~~~

评分

概念介紹……

评分

粗略看瞭一遍,沒有特彆深的感悟,也沒留下清晰的印象和知識架構。舉的例子還行,淺入淺齣吧~~~

评分

粗略看瞭一遍,沒有特彆深的感悟,也沒留下清晰的印象和知識架構。舉的例子還行,淺入淺齣吧~~~

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有