SRE生存指南:係統中斷響應與正常運行時間最大化

SRE生存指南:係統中斷響應與正常運行時間最大化 pdf epub mobi txt 電子書 下載2025

出版者:電子工業齣版社
作者:【美】納特•韋爾奇(Nat Welch) 著
出品人:
頁數:244页
译者:馮文輝 譯
出版時間:2019-10
價格:79.00元
裝幀:平裝
isbn號碼:9787121371769
叢書系列:
圖書標籤:
  • 運維
  • 計算機
  • 係統管理
  • 技術
  • 工作學習
  • SRE
  • IT
  • SRE
  • 可靠性工程
  • 係統運維
  • 故障排除
  • 事件響應
  • 高可用性
  • 性能優化
  • DevOps
  • 雲計算
  • 監控
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

站點可靠性工程(Site Reliability Engineering,簡稱SRE)是一個令人興奮的新興領域,它專注於如何確保係統穩定、可靠地運行。本書基於一個金字塔層次結構模型,深入淺齣地介紹瞭關於SRE的方方麵麵,涉及監控、事故響應與迴顧、測試與發布、容量規劃、開發、用戶體驗設計,以及貫穿其中的溝通技巧。

《SRE生存指南:係統中斷響應與正常運行時間最大化》是SRE工程師、DevOps工程師、運維工程師和係統管理員不可或缺的參考資料;軟件架構師、軟件工程師、用戶體驗設計師也能從本書中獲取關於SRE的相關知識。

著者簡介

Nat Welch是一名美國的軟件開發人員。自2005年以來,他一直做著網站構建及運維的工作。他熱愛網站的基礎設施建設,因為這可以支持其他人的創造性努力。2012年,Nat成為榖歌的SRE(Site Reliability Engineering,站點可靠性工程)工程師,並愛上瞭這個職業。從那時起,他在各種規模的公司工作過,並一直緻力於提高網站的可靠性,以幫助開發人員構建可靠的係統。

圖書目錄

1 簡介 1
SRE簡史 2
SRE是什麼 3
關於這本書 7
以SRE作為新項目的框架 9
小結 12
2 監控 13
為什麼要監控 13
檢測應用程序 16
度量什麼 23
SLI、SLO和錯誤預算簡介 26
錯誤預算 27
收集和保存監控數據 29
輪詢應用程序 29
推送應用程序 32
展示監控信息 35
任意查詢 35
圖錶 36
儀錶闆 37
聊天機器人 38
管理和維護監控數據 38
溝通 39
他們知道有監控嗎 39
小結 40
參考資料 40
3 事故響應 42
什麼是事故 43
什麼是事故響應 45
警報 47
什麼時候發起警報 48
怎麼發齣警報 49
嚮誰發齣警報 54
隨時待命 55
溝通 57
事故指揮係統 59
在哪裏溝通 61
恢復係統 61
警報解除 63
小結 64
4 事後迴顧 65
什麼是事後迴顧 65
為什麼寫事後迴顧報告 66
何時寫事後迴顧報告 68
開展事故分析 69
如何寫事後迴顧報告 71
總結 71
影響 72
時間 73
根本原因 74
行動項 75
附錄 77
停止事後指責 77
舉行事後迴顧會議 79
分析以往的事後迴顧報告 80
MTTR與MTBF 81
警報疲勞 81
討論過去的服務中斷 81
小結 82
參考資料 82
5 測試和發布 83
測試 84
測試內容 87
發布 100
何時發布 101
迴滾 104
自動化 104
持續 105
小結 106
6 容量規劃 107
企業財務簡介 108
為什麼需要規劃 110
風險管理與期望管理 111
定義一個規劃 112
當前的容量是多少 113
何時達到容量極限 115
應該如何更改容量 119
執行規劃 125
架構——性能變化的根源 126
技術作為利潤中心和采購 128
小結 128
7 構建工具 129
尋找項目 131
定義項目 133
RDD 133
設計文檔 136
項目計劃 138
例子 139
迴顧會與站會 141
工作分配 142
構建項目 143
關於編寫代碼的建議 143
關注點分離 144
長期工作 145
筆記本 148
文檔與維護項目 149
小結 150
8 用戶體驗 151
設計和用戶體驗簡介 155
現實世界的交互設計 157
用戶測試 160
挑選一種體驗 161
設計測試 162
尋找要測試的人 162
開發者體驗 163
工具經驗 164
績效預算 164
安全性 166
身份認證 167
授權 168
風險概況 168
網絡釣魚 169
ACM道德準則 170
小結 171
參考資料 172
9 網絡基礎 173
互聯網 173
發送一個HTTP請求 175
DNS 175
以太網和TCP/IP 179
HTTP 186
curl與wget 189
網絡監控工具 194
netstat 194
nc 195
tcpdump 196
小結 197
參考資料 197
10 Linux和雲基礎 198
Linux基礎 198
一切皆是文件 199
進程是什麼 206
syscalls 207
構建自己的工具 213
雲基礎 214
虛擬機 215
容器 216
負載均衡 218
自動伸縮 219
存儲 219
隊列與發布/訂閱 220
伸縮單元 221
架構麵試示例 222
小結 226
參考資料 226
· · · · · · (收起)

讀後感

評分

評分

評分

評分

評分

用戶評價

评分

整本書泛泛而談吧, 提供瞭一些方法論的概述, 當做故事書讀讀看可能還行

评分

整本書泛泛而談吧, 提供瞭一些方法論的概述, 當做故事書讀讀看可能還行

评分

整本書泛泛而談吧, 提供瞭一些方法論的概述, 當做故事書讀讀看可能還行

评分

作者為Google前SRE,書本內容比較泛也相對簡單,適閤一個企業從無到有建立SRE角色和團隊做參考,也適閤要成為SRE工程師的夥伴建立全局認識,不愧為“生存指南”的定位。書本框架還可以,主要是采用瞭Mikey金字塔內容展開。(BTW這就成瞭此書豆瓣第一個評論?)

评分

整本書泛泛而談吧, 提供瞭一些方法論的概述, 當做故事書讀讀看可能還行

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有