圖書標籤: 大數據 spark Spark 性能優化 計算機 Scala 編程 數據處理
发表于2025-03-12
Spark大數據處理:技術、應用與性能優化 pdf epub mobi txt 電子書 下載 2025
《Spark大數據處理:技術、應用與性能優化》根據最新技術版本,係統、全麵、詳細講解Spark的各項功能使用、原理機製、技術細節、應用方法、性能優化,以及BDAS生態係統的相關技術。
作為一個基於內存計算的大數據並行計算框架,Spark不僅很好地解決瞭數據的實時處理問題,而且保證瞭高容錯性和高可伸縮性。具體來講,它有如下優勢:
打造全棧多計算範式的高效數據流水綫
輕量級快速處理
易於使用,支持多語言
與HDFS等存儲層兼容
社區活躍度高
……
Spark已經在全球範圍內廣泛使用,無論是Intel、Yahoo!、Twitter、阿裏巴巴、百度、騰訊等國際互聯網巨頭,還是一些尚處於成長期的小公司,都在使用Spark。本書作者結閤自己在微軟和IBM實踐Spark的經曆和經驗,編寫瞭這本書。站著初學者的角度,不僅係統、全麵地講解瞭Spark的各項功能及其使用方法,而且較深入地探討瞭Spark的工作機製、運行原理以及BDAS生態係統中的其他技術,同時還有一些可供操作的案例,能讓沒有經驗的讀者迅速掌握Spark。更為重要的是,本書還對Spark的性能優化進行瞭探討。
高彥傑 畢業於中國人民大學,就職於IBM,精通Hadoop相關技術,較早接觸並使用Spark,對Spark應用開發、Spark係統的運維和測試比較熟悉,深度閱讀瞭Spark的源代碼,瞭解Spark的運行機製,擅長Spark的查詢優化。
瀏覽瞭第4章 ...
評分理論還要聯係實踐呀
評分瞭解spark係統原理的較好的入門書
評分理論還要聯係實踐呀
評分讀過主要部分,主要原理敘述很詳盡。Spark最近在互聯網公司應用越來越多,算子易用性很強。(機器學習讀書會2015.10開始讀的書)
有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
評分有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
評分有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
評分有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
評分有误,比如join,spark中的join是inner join,书中对着源码讲成了outer join.. 跑题,花了大量篇幅在FIFO,HASHMap的原理上... 以上 不过很多地方还是很详细的,而且通俗易懂
Spark大數據處理:技術、應用與性能優化 pdf epub mobi txt 電子書 下載 2025