第1章 運維的本質
1.1頂級公司的運維定義/ 2
1.1.1沒有運維的Netflix / 2
1.1.2 Netflix是如何成為行業典範的/ 3
1.1.3總結/ 7
1.2運維體係建設的核心概念:應用/ 7
1.2.1應用的起源/ 8
1.2.2應用模型及關係模型的建立/ 9
1.2.3微服務架構時代下為什麼要以應用為核心/ 12
第2章 運維體係建設
2.1標準化體係建設基礎/ 16
2.1.1標準化的原因和步驟/ 16
2.1.2基礎設施層麵的標準化/ 17
2.1.3應用層麵的標準化/ 19
2.1.4總結/ 21
2.2標準化體係建設實踐:基礎架構標準化/ 22
2.2.1常見的分布式基礎架構組件/ 23
2.2.2基礎架構組件的選型問題/ 24
2.2.3基礎架構的服務化/ 26
2.2.4運維的職責/ 27
2.3 應用運維體係建設:從生命周期的視角看 / 28
2.3.1 怎樣理解生命周期 / 29
2.3.2 應用的生命周期分析 / 30
2.3.3 總結 / 33
第3章 配置管理數據庫(CMDB)
3.1 CMDB的前世今生/ 36
3.1.1 CMDB源起/ 36
3.1.2傳統運維思路下的CMDB / 37
3.1.3互聯網運維體係下的CMDB / 39
3.1.4 CMDB進行時/ 40
3.2有瞭CMDB,為什麼還需要應用配置管理/ 41
3.2.1 CMDB是麵嚮資源的管理,是運維的基石/ 42
3.2.2應用配置管理是麵嚮應用的管理,是運維的核心/ 43
3.2.3總結/ 45
3.3在CMDB中落地應用的概念/ 46
3.3.1如何有效組織和管理應用/ 46
3.3.2應用的集群服務分組建設/ 49
3.3.3 CMDB在基礎服務體係中的核心位置/ 51
3.3.4總結/ 54
第4章 運維組織架構及模式
4.1運維組織架構和轉型/ 56
4.1.1自助化運維能力的建設/ 56
4.1.2從價值呈現的角度看運維/ 57
4.1.3運維協作模式的改變/ 59
4.1.4運維的組織架構/ 61
4.1.5總結/ 62
4.2 Google SRE的運維模式/ 63
4.2.1 SRE崗位的定位/ 63
4.2.2 SRE崗位的職責/ 64
4.2.3如何藉鑒和落地/ 67
4.3從Google CRE談運維的服務意識/ 67
4.3.1 CRE産生的背景/ 68
4.3.2 CRE崗位的職責/ 69
4.3.3從CRE談談做運維為什麼要有服務心態/ 70
4.4雲計算和AI時代下的運維轉型/ 73
4.4.1應用運維的轉型/ 75
4.4.2雲計算和AI帶給我們的挑戰/ 78
4.4.3總結/ 80
第5章 持續交付
5.1提升效率,為什麼要先做持續交付/ 84
5.1.1什麼是持續交付/ 85
5.1.2持續交付的關鍵點/ 86
5.2持續交付的第一關鍵點:配置管理/ 88
5.2.1版本控製/ 89
5.2.2依賴管理/ 90
5.2.3軟件配置/ 91
5.3多環境配置管理/ 94
5.3.1多環境問題/ 94
5.3.2不同環境下的應用配置管理/ 95
5.3.3環境配置管理解決方案/ 96
5.3.4總結/ 100
5.4多環境建設/ 101
5.4.1環境分類/ 101
5.4.2綫下環境分類建設/ 102
5.4.3環境建設上的關鍵技術點/ 106
5.4.4總結/ 109
5.5綫上環境建設/ 110
5.5.1生産環境/ 110
5.5.2 Beta環境/ 112
5.5.3預發環境/ 113
5.5.4辦公網生産環境/ 116
5.5.5總結/ 117
5.6流水綫模式/ 118
5.6.1持續交付流水綫簡要說明/ 119
5.6.2項目需求分解/ 119
5.6.3提交階段之開發模式選擇/ 121
5.6.4開發模式的選型原則/ 123
5.7流水綫軟件構建/ 125
5.7.1構建環節/ 126
5.7.2幾個關鍵問題/ 127
5.8流水綫構建完成後的質量保障/ 131
5.8.1依賴規則限製/ 131
5.8.2功能測試/ 132
5.8.3非功能測試/ 133
5.8.4總結/ 135
5.9持續交付實踐:根據業務場景找方案/ 136
5.9.1軟件的持續部署發布/ 137
5.9.2發布策略/ 139
5.9.3持續交付體係的收益/ 141
5.9.4總結/ 141
第6章 穩定性保障
6.1極端業務場景下的穩定性保障/ 144
6.1.1我們所麵對的極端業務場景/ 144
6.1.2技術上的挑戰/ 146
6.1.3極端業務場景下的不確定因素/ 148
6.2穩定性實踐/ 150
6.2.1容量規劃/ 150
6.2.2限流降級/ 160
6.2.3開關和預案/ 167
6.2.4全鏈路跟蹤係統/ 172
第7章 故障管理
7.1我對故障的理解/ 182
7.2故障定級和定責/ 186
7.2.1故障的定級標準/ 187
7.2.2故障的定責標準/ 189
7.3故障定責的目的/ 192
7.3.1關於定責和處罰/ 192
7.3.2目的是鼓勵做事,而不是處罰錯誤/ 194
7.3.3處罰的“負”作用遠超我們的想象/ 196
7.4故障應急和故障復盤/ 197
7.4.1故障應急/ 198
7.4.2故障復盤/ 201
7.4.3定期總結故障案例/ 203
7.4.4總結/ 204
第8章 雲運維的技術選型
8.1為什麼蘑菇街會選擇上雲/ 206
8.1.1我們所麵臨的問題/ 206
8.1.2縱觀技術發展趨勢/ 211
8.1.3沒有銀彈/ 212
8.2為什麼混閤雲是未來雲計算的主流形態/ 213
8.2.1關於混閤雲/ 213
8.2.2我們所經曆的幾個基礎設施建設階段/ 215
8.2.3總結/ 219
8.3麵嚮應用層的雲架構解決方案:Spring Cloud / 219
8.3.1 Spring Cloud框架中雲的影子/ 220
8.3.2 CNCF / 223
8.3.3可以預見的技術發展趨勢/ 224
8.4雲計算時代的彈性伸縮/ 225
8.4.1彈性伸縮的主體是誰/ 225
8.4.2總結/ 228
第9章CDN
9.1從CDN和雲存儲來聊聊雲生態的崛起/ 230
9.1.1 CDN和雲存儲/ 230
9.1.2雲生態的優勢/ 231
9.1.3總結/ 234
9.2頁麵靜態化架構和二級CDN建設/ 235
9.2.1靜態化架構建設的業務場景/ 235
9.2.2頁麵靜態化架構/ 237
9.2.3靜態化架構在大促場景中的應用/ 239
9.2.4二級CDN建設/ 240
9.2.5總結/ 241
第10章 運維人員的成長之路
10.1我是如何走上運維崗位的/ 244
10.1.1我是怎麼開始做運維工作的/ 244
10.1.2我為什麼會把運維當作職業發展的方嚮/ 247
10.1.3給我們的一點啓發/ 251
10.2運維需要懂産品和運營嗎/ 252
10.2.1運維的角色轉變和價值體現/ 253
10.2.2技術産品/ 254
10.2.3技術運營/ 254
10.2.4總結/ 256
10.3從技術到管理,如何轉身/ 257
10.3.1從員工離職說起/ 257
10.3.2關於員工離職的兩個觀點/ 258
10.3.3談談如何做好技術管理/ 259
10.3.4技術管理中引以為戒的一些反模式/ 261
10.3.5總結/ 262
10.4樹立個人品牌意識/ 263
10.4.1對求職者的背景調查/ 263
10.4.2如何樹立個人口碑/ 265
10.4.3要引以為戒的反例/ 266
10.4.4共勉/ 268
拓展閱讀:運維與安全
· · · · · · (
收起)