大規模分布式存儲係統

大規模分布式存儲係統 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:楊傳輝
出品人:
頁數:293
译者:
出版時間:2013-9-1
價格:59
裝幀:平裝
isbn號碼:9787111430520
叢書系列:大數據技術叢書
圖書標籤:
  • 分布式
  • 存儲
  • 大數據
  • 架構
  • 計算機
  • 軟件架構
  • distributed-system
  • 編程
  • 分布式存儲
  • 大規模係統
  • 雲計算
  • 數據存儲
  • 高可用
  • 容錯設計
  • 係統架構
  • 存儲性能
  • 可擴展性
  • 可靠性
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

《大規模分布式存儲係統:原理解析與架構實戰》是分布式係統領域的經典著作,由阿裏巴巴高級技術專傢“阿裏日照”(OceanBase核心開發人員)撰寫,陽振坤、章文嵩、楊衛華、汪源、餘鋒(褚霸)、賴春波等來自阿裏、新浪、網易和百度的資深技術專傢聯袂推薦。理論方麵,不僅講解瞭大規模分布式存儲係統的核心技術和基本原理,而且對榖歌、亞馬遜、微軟和阿裏巴巴等國際型大互聯網公司的大規模分布式存儲係統進行瞭分析;實戰方麵,首先通過對阿裏巴巴的分布式數據庫OceanBase的實現細節的深入剖析完整地展示瞭大規模分布式存儲係統的架構與設計過程,然後講解瞭大規模分布式存儲技術在雲計算和大數據領域的實踐與應用。

《大規模分布式存儲係統:原理解析與架構實戰》內容分為四個部分:基礎篇——分布式存儲係統的基礎知識,包含單機存儲係統的知識,如數據模型、事務與並發控製、故障恢復、存儲引擎、壓縮/解壓縮等;分布式係統的數據分布、復製、一緻性、容錯、可擴展性等。範型篇——介紹榖歌、亞馬遜、微軟、阿裏巴巴等著名互聯網公司的大規模分布式存儲係統架構,涉及分布式文件係統、分布式鍵值係統、分布式錶格係統以及分布式數據庫技術等。實踐篇——以阿裏巴巴的分布式數據庫OceanBase為例,詳細介紹分布式數據庫內部實現,以及實踐過程中的經驗。專題篇——介紹分布式係統的主要應用:雲存儲和大數據,這些是近年來的熱門領域,本書介紹瞭雲存儲平颱、技術與安全,以及大數據的概念、流式計算、實時分析等。

著者簡介

楊傳輝,阿裏巴巴高級技術專傢,花名日照,OceanBase核心開發人員,對分布式係統的理論和工程實踐有深刻理解。曾在百度作為核心成員參與類MapReduce係統、類Bigtable係統和百度分布式消息隊列等底層基礎設施架構工作。熱衷於分布式存儲和計算係統設計,樂於分享,有技術博客NosqlNotes。

圖書目錄

前言
第1章 概述
1.1 分布式存儲概念
1.2 分布式存儲分類
第一篇 基礎篇
第2章 單機存儲係統
2.1 硬件基礎
2.1.1 CPU架構
2.1.2 IO總綫
2.1.3 網絡拓撲
2.1.4 性能參數
2.1.5 存儲層次架構
2.2 單機存儲引擎
2.2.1 哈希存儲引擎
2.2.2 B樹存儲引擎
2.2.3 LSM樹存儲引擎
2.3 數據模型
2.3.1 文件模型
2.3.2 關係模型
2.3.3 鍵值模型
2.3.4 SQL與NoSQL
2.4 事務與並發控製
2.4.1 事務
2.4.2 並發控製
2.5 故障恢復
2.5.1 操作日誌
2.5.2 重做日誌
2.5.3 優化手段
2.6 數據壓縮
2.6.1 壓縮算法
2.6.2 列式存儲
第3章 分布式係統
3.1 基本概念
3.1.1 異常
3.1.2 一緻性
3.1.3 衡量指標
3.2 性能分析
3.3 數據分布
3.3.1 哈希分布
3.3.2 順序分布
3.3.3 負載均衡
3.4 復製
3.4.1 復製的概述
3.4.2 一緻性與可用性
3.5 容錯
3.5.1 常見故障
3.5.2 故障檢測
3.5.3 故障恢復
3.6 可擴展性
3.6.1 總控節點
3.6.2 數據庫擴容
3.6.3 異構係統
3.7 分布式協議
3.7.1 兩階段提交協議
3.7.2 Paxos協議
3.7.3 Paxos與2PC
3.8 跨機房部署
第二篇 範型篇
第4章 分布式文件係統
4.1 Google文件係統
4.1.1 係統架構
4.1.2 關鍵問題
4.1.3 Master設計
4.1.4 ChunkServer設計
4.1.5 討論
4.2 Taobao File System
4.2.1 係統架構
4.2.2 討論
4.3 Facebook Haystack
4.3.1 係統架構
4.3.2 討論
4.4 內容分發網絡
4.4.1 CDN架構
4.4.2 討論
第5章 分布式鍵值係統
5.1 Amazon Dynamo
5.1.1 數據分布
5.1.2 一緻性與復製
5.1.3 容錯
5.1.4 負載均衡
5.1.5 讀寫流程
5.1.6 單機實現
5.1.7 討論
5.2 淘寶Tair
5.2.1 係統架構
5.2.2 關鍵問題
5.2.3 討論
第6章 分布式錶格係統
6.1 Google Bigtable
6.1.1 架構
6.1.2 數據分布
6.1.3 復製與一緻性
6.1.4 容錯
6.1.5 負載均衡
6.1.6 分裂與閤並
6.1.7 單機存儲
6.1.8 垃圾迴收
6.1.9 討論
6.2 Google Megastore
6.2.1 係統架構
6.2.2 實體組
6.2.3 並發控製
6.2.4 復製
6.2.5 索引
6.2.6 協調者
6.2.7 讀取流程
6.2.8 寫入流程
6.2.9 討論
6.3 Windows Azure Storage
6.3.1 整體架構
6.3.2 文件流層
6.3.3 分區層
6.3.4 討論
第7章 分布式數據庫
7.1 數據庫中間層
7.1.1 架構
7.1.2 擴容
7.1.3 討論
7.2 Microsoft SQL Azure
7.2.1 數據模型
7.2.2 架構
7.2.3 復製與一緻性
7.2.4 容錯
7.2.5 負載均衡
7.2.6 多租戶
7.2.7 討論
7.3 Google Spanner
7.3.1 數據模型
7.3.2 架構
7.3.3 復製與一緻性
7.3.4 TrueTime
7.3.5 並發控製
7.3.6 數據遷移
7.3.7 討論
第三篇 實踐篇
第8章 OceanBase架構初探
8.1 背景簡介
8.2 設計思路
8.3 係統架構
8.3.1 整體架構圖
8.3.2 客戶端
8.3.3 RootServer
8.3.4 MergeServer
8.3.5 ChunkServer
8.3.6 UpdateServer
8.3.7 定期閤並&數據分發
8.4 架構剖析
8.4.1 一緻性選擇
8.4.2 數據結構
8.4.3 可靠性與可用性
8.4.4 讀寫事務
8.4.5 單點性能
8.4.6 SSD支持
8.4.7 數據正確性
8.4.8 分層結構
第9章 分布式存儲引擎
9.1 公共模塊
9.1.1 內存管理
9.1.2 基礎數據結構
9.1.3 鎖
9.1.4 任務隊列
9.1.5 網絡框架
9.1.6 壓縮與解壓縮
9.2 RootServer實現機製
9.2.1 數據結構
9.2.2 子錶復製與負載均衡
9.2.3 子錶分裂與閤並
9.2.4 UpdateServer選主
9.2.5 RootServer主備
9.3 UpdateServer實現機製
9.3.1 存儲引擎
9.3.2 任務模型
9.3.3 主備同步
9.4 ChunkServer實現機製
9.4.1 子錶管理
9.4.2 SSTable
9.4.3 緩存實現
9.4.4 IO實現
9.4.5 定期閤並&數據分發
9.4.6 定期閤並限速
9.5 消除更新瓶頸
9.5.1 讀寫優化迴顧
9.5.2 數據旁路導入
9.5.3 數據分區
第10章 數據庫功能
10.1 整體結構
10.2 隻讀事務
10.2.1 物理操作符接口
10.2.2 單錶操作
10.2.3 多錶操作
10.2.4 SQL執行本地化
10.3 寫事務
10.3.1 寫事務執行流程
10.3.2 多版本並發控製
10.4 OLAP業務支持
10.4.1 並發查詢
10.4.2 列式存儲
10.5 特色功能
10.5.1 大錶左連接
10.5.2 數據過期與批量刪除
第11章 質量保證、運維及實踐
11.1 質量保證
11.1.1 RD開發
11.1.2 QA測試
11.1.3 試運行
11.2 使用與運維
11.2.1 使用
11.2.2 運維
11.3 應用
11.3.1 收藏夾
11.3.2 天貓評價
11.3.3 直通車報錶
11.4 最佳實踐
11.4.1 係統發展路徑
11.4.2 人員成長
11.4.3 係統設計
11.4.4 係統實現
11.4.5 使用與運維
11.4.6 工程現象
11.4.7 經驗法則
第四篇 專題篇
第12章 雲存儲
12.1 雲存儲的概念
12.2 雲存儲的産品形態
12.3 雲存儲技術
12.4 雲存儲的核心優勢
12.5 雲平颱整體架構
12.5.1 Amazon雲平颱
12.5.2 Google雲平颱
12.5.3 Microsoft雲平颱
12.5.4 雲平颱架構
12.6 雲存儲技術體係
12.7 雲存儲安全
第13章 大數據
13.1 大數據的概念
13.2 MapReduce
13.3 MapReduce擴展
13.3.1 Google Tenzing
13.3.2 Microsoft Dryad
13.3.3 Google Pregel
13.4 流式計算
13.4.1 原理
13.4.2 Yahoo S4
13.4.3 Twitter Storm
13.5 實時分析
13.5.1 MPP架構
13.5.2 EMC Greenplum
13.5.3 HP Vertica
13.5.4 Google Dremel
參考資料
· · · · · · (收起)

讀後感

評分

在这书里,作者刀枪剑戟斧钺钩叉随手舞来,天文地理吃喝嫖赌样样通透。。 从书最开始对网络,存量,运行时间的估算就意思到,有严谨的态度才能做出合格的系统。离这样的架构师水平有好远的路要爬。 分布式可大可小,但要做到像书里介绍的那些商业化长度,又有好远的路要走. 该书即使...  

評分

这本书是目前互联网分布式存储技术的全景图,其中有2点对我特别受启发。 第1点,引用原文”Google的分布式存储系统一步步地从Bigtable到Megastore,再到Spanner,这也验证了分布式技术和传统关系数据库技术融合的必然性,即底层通过分布式技术实现可扩展性,上层通过关系数据...  

評分

看得出,作者水平还是非常强的,应该对很多开源的产品都深入研究过,也读过不少论文,就这一点,就可以推荐一下。很多原理性的东西,其实网上都有,大家更想看到的是他们在alibaba是如何应用的,有哪些优缺点,平时应用中遇到了哪些坑,呵呵。有一个建议,第一章提出的一些问题...

評分

在这书里,作者刀枪剑戟斧钺钩叉随手舞来,天文地理吃喝嫖赌样样通透。。 从书最开始对网络,存量,运行时间的估算就意思到,有严谨的态度才能做出合格的系统。离这样的架构师水平有好远的路要爬。 分布式可大可小,但要做到像书里介绍的那些商业化长度,又有好远的路要走. 该书即使...  

評分

第一遍阅读本书,对我理解这个领域的基本概念和基本问题有很大的帮助。 我自从半年前开始接触分布式系统的开发,虽然接触具体的分布式系统(FLINK)的代码已经有一段时间了,但是对于为什么要设计/使用分布式系统,分布式系统会遇到什么问题,这些问题都有些什么基本解法还是缺...  

用戶評價

评分

內容還不錯,組織得有點問題

评分

內容還不錯,組織得有點問題

评分

內容還不錯,組織得有點問題

评分

從宏觀層麵瞭解一下分布式存儲係統,ps:參考資料挺棒的

评分

各大廠的係統大雜燴,一半篇幅在推OceanBase,甚至連code review和師兄帶師弟也寫,不知道怎麼想的。話說16年雙十一之後沒見OceanBase齣來吹啊,這是內部被淘汰瞭?

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有