Spark快速數據處理

Spark快速數據處理 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:(美)Holden Karau
出品人:
頁數:0
译者:餘璜
出版時間:2014-4
價格:29.00
裝幀:
isbn號碼:9787111463115
叢書系列:大數據技術叢書
圖書標籤:
  • spark
  • 大數據
  • bigdata
  • 軟件開發
  • 計算機
  • Data
  • 機器學習
  • 擎天柱平颱組藏書
  • Spark
  • 大數據
  • 數據處理
  • 快速入門
  • 編程
  • 分布式計算
  • 數據科學
  • Java
  • Python
  • 實時處理
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

【編輯推薦】

從實用角度係統講解Spark的數據處理工具及使用方法

手把手教你充分利用Spark提供的各種功能,快速編寫高效分布式程序

【內容簡介】

Spark是一個開源的通用並行分布式計算框架,由加州大學伯剋利分校的AMP實驗室開發,支持內存計算、多迭代批量處理、即席查詢、流處理和圖計算等多種範式。Spark內存計算框架適閤各種迭代算法和交互式數據分析,能夠提升大數據處理的實時性和準確性,現已逐漸獲得很多企業的支持,如阿裏巴巴、百度、網易、英特爾等各大公司等。

本書係統講解Spark的使用方法,包括如何在多種機器上安裝Spark,如何配置一個Spark集群,如何在交互模式下運行第一個Spark作業,如何在Spark集群上構建一個生産級的脫機獨立作業,如何與Spark集群建立連接和使用SparkContext,如何創建和保存RDD(彈性分布式數據集),如何用Spark分布式處理數據,如何設置Shark,將Hive查詢集成到你的Spark作業中來,如何測試Spark作業,以及如何提升Spark任務的性能。

著者簡介

【作者簡介】

Holden Karau 資深軟件開發工程師,現就職於Databricks公司,之前曾就職於榖歌、亞馬遜、微軟和Foursquare等著名公司。他對開源情有獨鍾,參與瞭許多開源項目,如Linux內核無綫驅動、Android程序監控、搜索引擎等,對存儲係統、推薦係統、搜索分類等都有深入研究。

【譯者簡介】

餘璜 阿裏巴巴核心係統研發工程師,OceanBase核心開發人員,對分布式係統理論和工程實踐有深刻理解,專注於分布式係統設計、大規模數據處理,樂於分享,在CSDN上分享瞭大量技術文章。

張磊 Spark愛好者,曾參與分布式OLAP數據庫係統核心開發,熱衷於大數據處理、分布式計算。

圖書目錄

譯者序
作者簡介
前言
第1章 安裝Spark以及構建Spark集群 / 1
1.1 單機運行Spark / 4
1.2 在EC2上運行Spark / 5
1.3 在ElasticMapReduce上部署Spark / 11
1.4 用Chef(opscode)部署Spark / 12
1.5 在Mesos上部署Spark / 14
1.6 在Yarn上部署Spark / 15
1.7 通過SSH部署集群 / 16
1.8 鏈接和參考 / 21
1.9 小結 / 21
第2章 Spark shell的使用 / 23
2.1 加載一個簡單的text文件 / 24
2.2 用Spark shell運行邏輯迴歸 / 26
2.3 交互式地從S3加載數據 / 28
2.4 小結 / 30
第3章 構建並運行Spark應用 / 31
3.1 用sbt構建Spark作業 / 32
3.2 用Maven構建Spark作業 / 36
3.3 用其他工具構建Spark作業 / 39
3.4 小結 / 39
第4章 創建SparkContext / 41
4.1 Scala / 43
4.2 Java / 43
4.3 Java和Scala共享的API / 44
4.4 Python / 45
4.5 鏈接和參考 / 45
4.6 小結 / 46
第5章 加載與保存數據 / 47
5.1 RDD / 48
5.2 加載數據到RDD中 / 49
5.3 保存數據 / 54
5.4 連接和參考 / 55
5.5 小結 / 55
第6章 操作RDD / 57
6.1 用Scala和Java操作RDD / 58
6.2 用Python操作RDD / 79
6.3 鏈接和參考 / 83
6.4 小結 / 84
第7章 Shark-Hive和Spark的綜閤運用 / 85
7.1 為什麼用Hive/Shark / 86
7.2 安裝Shark / 86
7.3 運行Shark / 88
7.4 加載數據 / 88
7.5 在Spark程序中運行HiveQL查詢 / 89
7.6 鏈接和參考 / 92
7.7 小結 / 93
第8章 測試 / 95
8.1 用Java和Scala測試 / 96
8.2 用Python測試 / 103
8.3 鏈接和參考 / 104
8.4 小結 / 105
第9章 技巧和竅門 / 107
9.1 日誌位置 / 108
9.2 並發限製 / 108
9.3 內存使用與垃圾迴收 / 109
9.4 序列化 / 110
9.5 IDE集成環境 / 111
9.6 Spark與其他語言 / 112
9.7 安全提示 / 113
9.8 郵件列錶 / 113
9.9 鏈接和參考 / 113
9.10 小結 / 114
· · · · · · (收起)

讀後感

評分

饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。

評分

饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。

評分

饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。

評分

饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。

評分

饶了我吧,最近太背了,买了这么多垃圾书。 本来以为国外的书,内容会好一些 买来才发现,就是一本骗钱使用手册 薄薄的几页纸,还没doc全。 这样的东西也可以出书。。 实在太无聊了,正在纠结要不要退货呢。

用戶評價

评分

不如看doc

评分

你一定是在逗我

评分

這書:薄、沒實質性內容、spark版本太老,一句話不值得買,甚至不值得看。

评分

內容太少

评分

基本什麼都沒有講!

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有