圖書標籤: 大數據 spark Spark 性能優化 計算機 Scala 編程 數據處理
发表于2024-11-25
Spark大數據處理:技術、應用與性能優化 pdf epub mobi txt 電子書 下載 2024
《Spark大數據處理:技術、應用與性能優化》根據最新技術版本,係統、全麵、詳細講解Spark的各項功能使用、原理機製、技術細節、應用方法、性能優化,以及BDAS生態係統的相關技術。
作為一個基於內存計算的大數據並行計算框架,Spark不僅很好地解決瞭數據的實時處理問題,而且保證瞭高容錯性和高可伸縮性。具體來講,它有如下優勢:
打造全棧多計算範式的高效數據流水綫
輕量級快速處理
易於使用,支持多語言
與HDFS等存儲層兼容
社區活躍度高
……
Spark已經在全球範圍內廣泛使用,無論是Intel、Yahoo!、Twitter、阿裏巴巴、百度、騰訊等國際互聯網巨頭,還是一些尚處於成長期的小公司,都在使用Spark。本書作者結閤自己在微軟和IBM實踐Spark的經曆和經驗,編寫瞭這本書。站著初學者的角度,不僅係統、全麵地講解瞭Spark的各項功能及其使用方法,而且較深入地探討瞭Spark的工作機製、運行原理以及BDAS生態係統中的其他技術,同時還有一些可供操作的案例,能讓沒有經驗的讀者迅速掌握Spark。更為重要的是,本書還對Spark的性能優化進行瞭探討。
高彥傑 畢業於中國人民大學,就職於IBM,精通Hadoop相關技術,較早接觸並使用Spark,對Spark應用開發、Spark係統的運維和測試比較熟悉,深度閱讀瞭Spark的源代碼,瞭解Spark的運行機製,擅長Spark的查詢優化。
讀過主要部分,主要原理敘述很詳盡。Spark最近在互聯網公司應用越來越多,算子易用性很強。(機器學習讀書會2015.10開始讀的書)
評分計算機科學
評分除瞭最基本的rdd,甚至連stream都沒講。真是夠瞭
評分瀏覽瞭第4章 ...
評分讀過主要部分,主要原理敘述很詳盡。Spark最近在互聯網公司應用越來越多,算子易用性很強。(機器學習讀書會2015.10開始讀的書)
有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
評分有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
評分豆瓣的得分充分说明了问题,书不好,错误挺多的,说明作者一是不认真不尊重知识,二是水平格局有限。如果想深入了解而不被误导,不要读这本书了,误人子弟。
評分有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
評分有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
Spark大數據處理:技術、應用與性能優化 pdf epub mobi txt 電子書 下載 2024