Kudu:構建高性能實時數據分析存儲係統

Kudu:構建高性能實時數據分析存儲係統 pdf epub mobi txt 電子書 下載2025

出版者:電子工業齣版社
作者:【美】吉恩-馬剋·斯帕加裏(Jean-Marc Spaggiari) 等
出品人:
頁數:192
译者:常冰琳
出版時間:2019-3
價格:69.00元
裝幀:平裝
isbn號碼:9787121295416
叢書系列:
圖書標籤:
  • 大數據
  • 存儲
  • kudu
  • 技術
  • Kudu
  • 實時數據分析
  • 存儲係統
  • 大數據
  • 高性能
  • 分布式係統
  • Apache Kudu
  • 數據工程
  • 數據架構
  • 技術棧
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

要在Hadoop生態係統中實現數據的快速輸入和快速分析,一直以來隻有少數可用但是不夠完美的解決方案。它們要麼以緩慢的數據輸入為代價實現快速分析,要麼以緩慢的分析為代價實現快速的數據輸入。這個問題現在有瞭解決辦法,使用Apache Kudu基於列的數據存儲,可以很容易地對快速輸入的數據進行快速的分析。這就是本書的內容。

在《Kudu:構建高性能實時數據分析存儲係統》中,你將學習Kudu設計中的關鍵概念,以及如何用它構建快速、可擴展和可靠的應用程序。通過實際的示例,你將瞭解Kudu是如何與其他Hadoop生態係統組件(如Apache Spark、Spark SQL和Impala)集成的。

《Kudu:構建高性能實時數據分析存儲係統》適閤大數據係統的架構師、開發者和谘詢師閱讀。

著者簡介

圖書目錄

前言 ............................................................................... XIII
第1 章 為什麼會有Kudu ..................................................1
Kudu 為什麼重要 .................................................................................... 1
易用性驅動接納度 .................................................................................. 2
新的應用場景 ......................................................................................... 5
物聯網 ...........................................................................................................5
現有的實時分析方案 .....................................................................................7
實時處理 .....................................................................................................13
硬件環境 ............................................................................................... 15
Kudu 在大數據生態中的獨特位置 ........................................................ 17
與其他生態係統的組件對比 .......................................................................19
與大數據組件對比——HDFS、HBase 和Cassandra ..................................24
小結 ...................................................................................................... 26
第2 章 Kudu 簡介 ..........................................................27
Kudu 的高層設計 .................................................................................. 29
Kudu 中的角色 ............................................................................................29
master 服務器 ..............................................................................................31
tablet 服務器................................................................................................32
Kudu 中的概念與機製 .......................................................................... 42
熱點 .............................................................................................................42
分區 .............................................................................................................44
第3 章 安裝與運行 .........................................................49
安裝 ...................................................................................................... 49
使用Kudu Quickstart VM ...........................................................................49
使用Cloudera Manager ...............................................................................51
從源代碼構建 ..............................................................................................52
軟件包 .........................................................................................................53
Cloudera Quickstart VM ..............................................................................53
快速安裝:3 分鍾或者更短 .................................................................. 54
小結 ...................................................................................................... 58
第4 章 Kudu 的管理 .......................................................59
為Kudu 做規劃 ..................................................................................... 59
master 服務器和tablet 服務器 .....................................................................60
預寫日誌 .....................................................................................................65
數據服務器和存儲 ......................................................................................68
復製策略(replication strategy) ..................................................................69
部署時的注意事項:是采用新集群還是現有集群 ................................ 70
全新的僅有Kudu 的集群 ............................................................................70
全新的包含Kudu 的Hadoop 集群 ..............................................................71
在現有的Hadoop 集群中添加Kudu ...........................................................77
tablet 服務器和master 服務器的Web UI .............................................. 81
master 服務器UI 和tablet 服務器UI ..........................................................82
master 服務器UI .........................................................................................83
tablet 服務器UI ...........................................................................................83
Kudu 命令行接口 .................................................................................. 84
集群 .............................................................................................................84
文件係統 .....................................................................................................86
tablet 副本 ...................................................................................................92
與Raft 一緻性相關的元數據.....................................................................106
添加和刪除tablet 服務器 .................................................................... 107
添加tablet 服務器 .....................................................................................107
刪除tablet 服務器 .....................................................................................108
安全 .................................................................................................... 109
一個簡單的類比 ........................................................................................ 110
Kudu 的安全功能 ...................................................................................... 112
基本的性能調優 .................................................................................. 117
Kudu 的內存限製 ...................................................................................... 117
維護管理器的綫程 .................................................................................... 118
監控性能 ................................................................................................... 119
未雨綢繆,遠離麻煩 .......................................................................... 119
避免耗盡磁盤空間 .................................................................................... 119
容忍磁盤故障 ............................................................................................120
備份 ...........................................................................................................120
小結 .................................................................................................... 121
第5 章 Kudu 常用的開發接口 .......................................123
客戶端API .......................................................................................... 124
Kudu Client(客戶端)...............................................................................124
Kudu Table ................................................................................................125
Kudu DDL .................................................................................................125
Kudu 掃描器(Scanner)讀取模式 ...........................................................126
C++ API .............................................................................................. 127
Python API .......................................................................................... 130
準備Python 開發環境 ...............................................................................131
使用Python 開發Kudu 應用 .....................................................................131
Java ..................................................................................................... 135
Java 應用 ...................................................................................................137
Spark ................................................................................................... 140
在Impala 中使用Kudu ....................................................................... 145
第6 章 錶和模式設計 ...................................................149
模式設計基礎 ..................................................................................... 150
在綫事務處理/ 在綫分析處理混閤的模式設計 .................................. 151
Lambda 架構 .............................................................................................151
OLTP/OLAP 拆分 ......................................................................................152
主鍵和列的設計 .................................................................................. 153
列模式的其他注意事項 .............................................................................154
分區的基礎知識 .................................................................................. 160
範圍分區 ...................................................................................................161
哈希分區 ...................................................................................................161
模式的更改 ......................................................................................... 162
最佳實踐和提示 .................................................................................. 163
分區 ...........................................................................................................163
大對象 .......................................................................................................164
decimal(十進製數)..................................................................................164
不重復的字符串 ........................................................................................165
壓縮 ...........................................................................................................165
對象的命名 ................................................................................................165
列的數量 ...................................................................................................165
二進製類型 ................................................................................................166
網絡包示例 ......................................................................................... 166
小結 .................................................................................................... 168
第7 章 Kudu 用例 ........................................................169
實時物聯網分析 .................................................................................. 169
預測建模 ............................................................................................. 173
多平颱混閤方案 .................................................................................. 176
關於作者 ........................................................................180
封麵圖片 ........................................................................182
· · · · · · (收起)

讀後感

評分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

評分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

評分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

評分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

評分

众所周知,大数据诞生于Google的三篇论文:GFS(2003)、MapReduce(2004)、Bigtable(2006),而Google的另外三篇论文:Caffeine(2009)、Pregel(2010)、Dremel(2010),又开启了大数据的后航海时代。本文结合最近看的关于HBase、Kudu等列式存储,以及OLAP相关书籍,针对...

用戶評價

评分

簡單介紹

评分

簡單介紹

评分

簡單介紹

评分

簡單介紹

评分

簡單介紹

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有