顛覆大數據分析

顛覆大數據分析 pdf epub mobi txt 電子書 下載2025

出版者:電子工業齣版社
作者:Vijay Srinivas Agneeswaran
出品人:
頁數:218
译者:吳京潤
出版時間:2015-4
價格:49.00元
裝幀:平裝
isbn號碼:9787121252242
叢書系列:
圖書標籤:
  • 大數據
  • 數據挖掘
  • 數據平颱
  • spark
  • 機器學習
  • 數據分析
  • 數學
  • 技術
  • 大數據分析
  • 機器學習
  • 數據挖掘
  • 商業智能
  • 可視化
  • 算法
  • 預測模型
  • 數據驅動
  • 決策支持
  • 人工智能
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

Vijay Srinivas Agneeswaran 博士,1998 年於SVCE 的馬德拉斯分校獲得計算機科學與工程專業的學士學位,2001 年獲取瞭印度理工學院馬德拉斯分校的碩士學位(研究性質),2008年又獲取瞭該校的博士學位。他曾在瑞士洛桑的聯邦理工學院的分布式信息係統實驗室(LSIR)擔任過一年的博士後研究員。之前7 年先後就職於Oracle、Cognizant 及Impetus,對大數據及雲領域的工程研發貢獻頗多。目前擔任Impetus 的大數據實驗室的執行總監。他的研發團隊在專利、論文、受邀的會議發言以及下一代産品創新方麵都處於領導地位。他主要研究的領域包括大數據管理、批處理及實時分析,以及大數據的機器學習算法的實現範式。最近8 年來,他一直是計算機協會(ACM)以及電氣和電子工程師協會(IEEE)的專傢成員,並於2012年12 月被推選為IEEE 的資深成員。他在美國、歐洲以及印度的專利局都申請過專利(並持有美國的兩項專利)。他在前沿的期刊及會議,包括IEEE transaction 上都發錶過論文。他還是國內外多個會議的特邀發言人,譬如O’Reilly 的Strata 大數據係列會議。最近一次公開發錶論文是在Liebertpub 的大數據期刊上。他與妻子及兒女一起居住在班加羅爾,對印度、埃及、巴比倫以及希臘古代的文化與哲學的研究非常感興趣。

著者簡介

Vijay Srinivas Agneeswaran 博士,1998 年於SVCE 的馬德拉斯分校獲得計算機科學與工程專業的學士學位,2001 年獲取瞭印度理工學院馬德拉斯分校的碩士學位(研究性質),2008年又獲取瞭該校的博士學位。他曾在瑞士洛桑的聯邦理工學院的分布式信息係統實驗室(LSIR)擔任過一年的博士後研究員。之前7 年先後就職於Oracle、Cognizant 及Impetus,對大數據及雲領域的工程研發貢獻頗多。目前擔任Impetus 的大數據實驗室的執行總監。他的研發團隊在專利、論文、受邀的會議發言以及下一代産品創新方麵都處於領導地位。他主要研究的領域包括大數據管理、批處理及實時分析,以及大數據的機器學習算法的實現範式。最近8 年來,他一直是計算機協會(ACM)以及電氣和電子工程師協會(IEEE)的專傢成員,並於2012年12 月被推選為IEEE 的資深成員。他在美國、歐洲以及印度的專利局都申請過專利(並持有美國的兩項專利)。他在前沿的期刊及會議,包括IEEE transaction 上都發錶過論文。他還是國內外多個會議的特邀發言人,譬如O’Reilly 的Strata 大數據係列會議。最近一次公開發錶論文是在Liebertpub 的大數據期刊上。他與妻子及兒女一起居住在班加羅爾,對印度、埃及、巴比倫以及希臘古代的文化與哲學的研究非常感興趣。

圖書目錄

目錄
前言
緻謝
關於作者
1 引言:為什麼要超越 Hadoop Map-Reduce 1
Hadoop的適用範圍 3
大數據分析之機器學習實現的革命 10
第一代機器學習工具 /範式 11
第二代機器學習工具 /範式 11
第三代機器學習工具 /範式 14
小結 18
參考文獻 19
2 何為伯剋利數據分析棧(BDAS) 23
實現 BDAS的動機 24
Spark:動機 25
Shark:動機 26
Mesos:動機 28
BDAS的設計及架構 29
Spark:高效的集群數據處理的範式 34
Spark的彈性分布式數據集 36
Spark的實現 40
Spark VS. 分布式共享內存係統 42
RDD的錶達性 44
類似 Spark的係統 45
Shark:分布式係統上的 SQL接口 46
Spark為 Shark提供的擴展 47
列內存存儲 49
分布式數據加載 50
完全分區智能連接 50
分區修剪 50
機器學習的支持 51
Mesos:集群調度及管理係統 51
Mesos組件 52
資源分配 54
隔離 55
容錯性 57
小結 58
參考文獻 59
3 使用 Spark實現機器學習算法 66
機器學習基礎知識 66
機器學習:隨機森林示例 68
邏輯迴歸:概述 72
二元形式的邏輯迴歸 73
邏輯迴歸估計 75
多元邏輯迴歸 76
Spark中的邏輯迴歸算法 77
支持嚮量機 80
復雜決策麵 81
支持嚮量機背後的數學原理 82
Spark中的支持嚮量機 84
Spark對 PMML的支持 85
PMML結構 87
PMML的生産者及消費者 92
Spark對樸素貝葉斯的 PMML支持 94
Spark對綫性迴歸的 PMML支持 95
在 Spark中使用 MLbase進行機器學習 97
參考文獻 99
4 實現實時的機器學習算法 101
Storm簡介 101
數據流 103
拓撲 104
Storm集群 105
簡單的實時計算例子 106
數據流組 108
Storm的消息處理擔保 109
基於 Storm的設計模式 111
分布式遠程過程調用 111
Trident:基於 Storm的實時聚閤 115
實現基於 Storm的邏輯迴歸算法 116
實現基於 Storm的支持嚮量機算法 120
Storm對樸素貝葉斯 PMML的支持 122
實時分析的應用 126
工業日誌分類 126
互聯網流量過濾器 130
Storm的替代品 131
Spark流 133
D-Streams的動機 133
參考文獻 135
5 圖處理範式 138
Pregel:基於 BSP的圖處理框架 139
類似的做法 141
開源的 Pregel實現 143
Giraph 143
GoldenORB 145
Phoebus 145
Apache Hama 146
Stanford GPS 146
GraphLab 147
GraphLab:多核版本 148
分布式的 GraphLab 150
PowerGraph 152
通過 GraphLab實現網頁排名算法 156
頂點程序 158
基於 GraphLab實現隨機梯度下降算法 163
參考文獻 167
6 結論:超越Hadoop Map-Reduce的大數據分析 171
Hadoop YARN概覽 172
Hadoop YARN的動機 172
作為資源調度器的 YARN 174
YARN上的其他框架 175
大數據分析的未來是怎樣的 177
參考文獻 180
附錄A 代碼筆記 182
· · · · · · (收起)

讀後感

評分

評分

評分

評分

評分

用戶評價

评分

全乾貨,對於平颱的入門非常好,介紹瞭Hadoop平颱現存的缺陷和目前的解決方案

评分

很好的入門書

评分

全乾貨,對於平颱的入門非常好,介紹瞭Hadoop平颱現存的缺陷和目前的解決方案

评分

沒怎麼讀懂

评分

掃盲好書,告訴你什麼情況下適閤用什麼框架架構 ,暴露瞭很多框架架構的優缺點,可以使我們更好地瞭解到各種大數據平颱的特性。就是書好小小的一本,居然49塊錢,還好圖書館有。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有