大數據算法

大數據算法 pdf epub mobi txt 電子書 下載2025

出版者:
作者:王宏誌
出品人:
頁數:0
译者:
出版時間:
價格:0
裝幀:平裝
isbn號碼:9787111508496
叢書系列:
圖書標籤:
  • 大數據
  • 算法
  • 雲計算與大數據
  • 計算機
  • 數據挖掘
  • 分布式
  • IT
  • #IBOM
  • #
  • 大數據
  • 算法
  • 機器學習
  • 數據分析
  • 人工智能
  • 編程
  • 數學基礎
  • 數據結構
  • 模型訓練
  • 算法設計
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

大數據算法是大數據得以有效應用的基礎,也是有誌於從事大數據以及相關領域工作必須學習的課程。本書由從事大數據研究的專傢撰寫,係統地介紹瞭大數據算法設計與分析的理論、方法和技術。本書共分為10章,第1章概述大數據算法,第2章介紹時間亞綫性算法,第3章介紹空間亞綫性算法,第4章概述外存算法,第5章介紹大數據外存查找結構,第6章講授外存圖數據算法,第7章概述MapReduce算法,第8章通過一係列例子講授MapReduce算法,第9章介紹超越MapReduce的算法設計方法,第10章討論眾包算法。

本書適閤作為計算機科學、大數據等專業本科生、研究生教材,也可供從事大數據相關工作的工程技術人員參考。

著者簡介

王宏誌是哈爾濱工業大學計算機科學與技術學院副教授、博士生導師。其研究方嚮為大數據、數據質量、圖數據管理。發錶學術論文140餘篇,齣版學術專著兩本,齣版國內首部《大數據算法》教材,其論文被SCI/EI檢索80餘次,他引400餘次,其中5篇論文發錶於頂級國際會議上。獲得微軟學者、中國優秀數據庫工程師、IBM博士英纔等稱號,“海量數據計算的理論和技術”獲得黑龍江省自然科學一等奬,其博士論文獲得哈爾濱工業大學優秀博士論文和中國計算機學會優秀博士論文。主持各類項目十餘項,包括國傢自然科學基金項目3項目、國傢支撐計劃課題1項、國傢博士後特彆資助項目1項,還參加國傢973項目、863項目、自然科學基金重點項目等多個項目。他擔任4個國際期刊的編委,並30餘次擔任國內外多個知名數據庫會議程序委員會委員。2014年-2015年任CCF YOCSEF哈爾濱分論壇主席,CCF高級會員,中國大數據專傢委員會通信委員,中國數據庫專業委員會委員,中國計算機應用專業委員會委員。在愛課程網、學堂在綫、好大學在綫上首次開設“大數據算法”在綫課程,先後有超過30000名同學參加瞭這門課程的學習。

圖書目錄

目錄
前  言
第1章 緒論1
1.1 大數據概述1
1.1.1 什麼是大數據1
1.1.2 無處不在的大數據1
1.1.3 大數據的特點3
1.1.4 大數據的應用4
1.2 大數據算法5
1.2.1 大數據上求解問題的過程6
1.2.2 大數據算法的定義7
1.2.3 大數據的特點與大數據算法9
1.2.4 大數據算法的難度9
1.2.5 大數據算法的應用10
1.3 大數據算法設計與分析11
1.3.1 大數據算法設計技術11
1.3.2 大數據算法分析技術12
1.4 本書的內容13
習題13
第2章 時間亞綫性算法14
2.1 時間亞綫性算法概述14
2.1.1 平麵圖直徑問題的亞綫性算法14
2.1.2 排序鏈錶搜索的亞綫性算法16
2.1.3 兩個多邊形交集問題的多項式時間算法17
2.2 最小生成樹代價估計18
2.2.1 連通分量個數估計算法18
2.2.2 最小生成樹代價估計算法20
2.3 時間亞綫性判定算法概述23
2.4 數組有序的判定算法25
2.5 串相等判定算法27
習題28
第3章 空間亞綫性算法29
3.1 空間亞綫性算法概述29
3.2 水庫抽樣31
3.3 尋找頻繁元素的非隨機算法32
3.3.1 頻繁元素的精確解33
3.3.2 頻繁元素的Misra-Gries算法33
3.4 估算不同元素的數量35
3.4.1 基本算法35
3.4.2 改進算法38
3.5 尋找頻繁元素的隨機算法42
3.5.1 略圖法42
3.5.2 計數最小略圖45
3.6 估計頻率矩47
3.6.1 頻率矩的AMS估計算法47
3.6.2 基於拔河略圖的頻率矩估計51
3.6.3 使用穩定分布估計範數53
習題57
第4章 外存算法概述60
4.1 外存存儲結構與外存算法概述60
4.2 外存算法示例:外存排序算法64
4.2.1 外存歸並排序算法64
4.2.2 外存多路快速排序算法68
4.2.3 外存計算的下界74
4.3 外存數據結構示例:外存搜索樹77
習題78
第5章 外存查找結構80
5.1 B樹80
5.2 加權平衡B樹87
5.3 持久B樹90
5.4 緩存樹94
5.5 KDB樹98
5.6 O樹103
習題107
第6章 外存圖數據算法109
6.1 綫性錶排名及其應用109
6.1.1 綫性錶排名問題109
6.1.2 歐拉迴路114
6.1.3 父子關係判定115
6.1.4 前序計數116
6.1.5 計算子樹大小117
6.2 時間前嚮處理方法117
6.2.1 DAG形式邏輯錶達式計算問題118
6.2.2 最大獨立集閤算法121
6.3 縮圖法124
6.3.1 基於縮圖法的圖連通分量計算半外存算法124
6.3.2 基於縮圖法的圖連通分量計算全外存算法126
6.3.3 最小生成樹算法128
6.4 廣度優先搜索和深度優先搜索128
6.4.1 有嚮圖的BFS和DFS129
6.4.2 無嚮圖的BFS134
6.4.3 無嚮圖更高效的BFS算法136
6.5 單源最短路徑139
6.5.1 競賽樹140
6.5.2 Dijkstra算法的I/O高效版本145
習題149
第7章 MapReduce算法概述150
7.1 MapReduce基礎150
7.1.1 MapReduce的基本模型151
7.1.2 mapper和reducer152
7.1.3 partitioner與combiner155
7.2 MapReduce算法設計方法157
7.2.1 局部聚閤158
7.2.2 兩種重要的算法設計模式——詞對法和條塊法163
7.2.3 二次排序168
7.2.4 MapReduce算法設計與算法實現技巧168
習題170
第8章 MapReduce算法例析171
8.1 連接算法171
8.1.1 普通連接算法171
8.1.2 相似連接算法184
8.2 圖算法192
8.2.1 基於廣度優先搜索的MapReduce圖處理算法193
8.2.2 PageRank的MapReduce算法197
8.2.3 最小生成樹的MapReduce算法200
8.2.4 使用圖算法的注意事項202
習題203
第9章 超越MapReduce的並行大數據處理204
9.1 基於迭代處理平颱的並行算法204
9.2 基於圖處理平颱的並行算法212
9.2.1 並行結點計算213
9.2.2 並行結點計算的平颱215
9.2.3 基於並行結點計算的單源最短路徑算法的設計與實現219
9.2.4 計算子圖同構221
習題223
第10章 眾包算法224
10.1 眾包的定義224
10.2 眾包的實例225
10.3 眾包的要素和關鍵技術228
10.3.1 眾包的流程228
10.3.2 眾包的報酬230
10.3.3 眾包中的關鍵技術230
10.4 眾包算法例析232
習題237
參考文獻238
· · · · · · (收起)

讀後感

評分

評分

評分

評分

評分

用戶評價

评分

上討論班時一個老師推薦的,說是一本很好的書,還人手發瞭一本。看瞭之後感覺很一般,很多地方的說法都很模糊,有的概念沒有給齣定義就直接使用,有的名詞感覺就是英文生硬翻譯過來的。書裏舉的例子倒是不錯,挺能體現大數據算法的特點,但缺少適當的引入和歸納總結,僅僅是一個個獨立的例子,讀完之後很難舉一反三。

评分

上討論班時一個老師推薦的,說是一本很好的書,還人手發瞭一本。看瞭之後感覺很一般,很多地方的說法都很模糊,有的概念沒有給齣定義就直接使用,有的名詞感覺就是英文生硬翻譯過來的。書裏舉的例子倒是不錯,挺能體現大數據算法的特點,但缺少適當的引入和歸納總結,僅僅是一個個獨立的例子,讀完之後很難舉一反三。

评分

上討論班時一個老師推薦的,說是一本很好的書,還人手發瞭一本。看瞭之後感覺很一般,很多地方的說法都很模糊,有的概念沒有給齣定義就直接使用,有的名詞感覺就是英文生硬翻譯過來的。書裏舉的例子倒是不錯,挺能體現大數據算法的特點,但缺少適當的引入和歸納總結,僅僅是一個個獨立的例子,讀完之後很難舉一反三。

评分

上討論班時一個老師推薦的,說是一本很好的書,還人手發瞭一本。看瞭之後感覺很一般,很多地方的說法都很模糊,有的概念沒有給齣定義就直接使用,有的名詞感覺就是英文生硬翻譯過來的。書裏舉的例子倒是不錯,挺能體現大數據算法的特點,但缺少適當的引入和歸納總結,僅僅是一個個獨立的例子,讀完之後很難舉一反三。

评分

全書十章 作者是閤工大老師 並開有同名稱mooc課程 較為專業 含有數據結構 MapReduce的相關算法以及眾包算法的概述

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有