第1章 NoSQL和事務處理 1
簡介 1
1.1 批處理中的數據庫事務處理 1
1.2 磁盤處理中的事務處理 2
1.3 ACID 2
1.4 悲觀並發詳解 4
1.4.1 隔離級彆 5
1.4.2 私有的隔離級彆 7
1.5 CAP定理 8
1.6 BASE 9
1.7 服務器端一緻性 10
1.8 錯誤處理 11
1.9 為什麼在這些場景下SQL不能發揮作用 11
總結思考 12
參考文獻 12
第2章 列式數據庫 13
簡介 13
2.1 列式數據庫的曆史 14
2.2 技術原理 19
2.3 查詢優化 19
2.4 多用戶和硬件 19
2.5 執行一個ALTER語句 20
2.6 數據倉庫和列式數據庫 21
總結思考 21
參考文獻 22
第3章 圖數據庫 23
簡介 23
3.1 圖論基礎 24
3.1.1 節點 24
3.1.2 邊 25
3.1.3 圖的結構 25
3.2 RDBMS與圖數據庫 26
3.3 凱文?貝肯問題的六度 26
3.3.1 通用圖的鄰接錶模型 27
3.3.2 通用圖的覆蓋路徑模型 30
3.3.3 真實數據的復雜關係 32
3.4 頂點覆蓋 34
3.5 圖編程工具 35
3.5.1 圖數據庫 36
3.5.2 圖數據庫語言 36
總結思考 39
參考文獻 39
第4章 MapReduce模型 41
簡介 41
4.1 Hadoop分布式文件係統 43
4.2 查詢語言 43
4.2.1 Pig Latin 43
4.2.2 Hive和其他工具 52
總結思考 54
參考文獻 54
第5章 流式數據庫和復雜事件 55
簡介 55
5.1 代並發模型 56
5.1.1 樂觀並發 56
5.1.2 樂觀並發下的隔離級彆 56
5.2 復雜事件處理 58
5.2.1 與事件處理相關的術語 59
5.2.2 事件處理與狀態更改約束 61
5.2.3 事件處理與Petri網 62
5.3 商業産品 63
5.3.1 StreamBase 63
5.3.2 Kx 66
總結思考 68
參考文獻 68
第6章 鍵值存儲 69
簡介 69
6.1 模式與無模式 69
6.2 查詢與檢索 70
6.3 “鍵”的處理 70
6.3.1 Berkeley DB 71
6.3.2 通過樹索引或散列訪問 71
6.4 “值”的處理 71
6.4.1 任意字節數組 72
6.4.2 已知結構的小文件 72
6.5 産品 73
總結思考 75
第7章 文本數據庫 77
簡介 77
7.1 經典文檔管理係統 77
7.1.1 文件索引和存儲 78
7.1.2 關鍵字和題內關鍵字 78
7.1.3 行業標準 79
7.2 文本挖掘與理解 83
7.2.1 語義與語法 83
7.2.2 語義網 84
7.3 語言問題 85
7.3.1 Unicode和ISO標準 86
7.3.2 機器翻譯 86
總結思考 87
參考文獻 88
第8章 地圖數據 89
簡介 89
8.1 GIS查詢 90
8.1.1 簡單位置 90
8.1.2 簡單距離 91
8.1.3 在一個區域中查找數量、密度和內容 91
8.1.4 鄰近關係 91
8.1.5 時間關係 91
8.2 定位 92
8.2.1 經度和緯度 92
8.2.2 層次三角網格 93
8.2.3 街道地址 95
8.2.4 郵政編號 96
8.2.5 ZIP編碼 96
8.2.6 加拿大郵政編碼 96
8.2.7 英國郵政編碼 97
8.3 GIS的SQL擴展 99
總結思考 99
參考文獻 100
第9章 大數據和雲計算 101
簡介 101
9.1 對大數據和雲計算的疑問 102
9.1.1 雲計算僅是一種時尚 103
9.1.2 雲計算沒有內部數據服務器那麼安全 103
9.1.3 雲計算代價高昂 103
9.1.4 雲計算太復雜 103
9.1.5 雲計算對大公司纔有意義 104
9.1.6 隻是技術上的改變 104
9.1.7 如果網絡中斷,雲計算將毫無用處 105
9.2 大數據和數據挖掘 105
9.2.1 用於非傳統分析的大數據 106
9.2.2 係統閤並的大數據 107
總結思考 107
參考文獻 108
第10章 生物特徵、指紋和專業數據庫 109
簡介 109
10.1 原生生物特徵 110
10.2 指紋 111
10.2.1 分類 112
10.2.2 匹配 113
10.2.3 NIST標準 113
10.3 DNA識彆 115
基本原則和技術 116
10.4 麵部數據庫 117
10.4.1 曆史 118
10.4.2 誰在使用麵部數據庫 119
10.4.3 它有多好 120
總結思考 121
參考文獻 121
第11章 分析型數據庫 123
簡介 123
11.1 數據立方體 123
11.2 Codd博士的OLAP規則 124
11.2.1 Codd博士理論的基礎特性 124
11.2.2 獨有特性 126
11.2.3 報錶特性 126
11.2.4 維度控製 127
11.3 MOLAP 127
11.4 ROLAP 128
11.5 HOLAP 128
11.6 OLAP查詢語言 128
11.7 SQL中的聚閤操作符 129
11.7.1 GROUP BY GROUPING SET 129
11.7.2 ROLLUP 130
11.7.3 CUBE 131
11.7.4 用法須知 132
11.8 SQL中的OLAP操作符 132
11.8.1 OLAP功能 133
11.8.2 NTILE(n) 138
11.8.3 嵌套的OLAP函數 138
11.8.4 查詢樣例 139
11.9 稀疏的數據立方體 140
11.9.1 數據立方體 140
11.9.2 維度分層 141
11.9.3 下鑽和切片 142
總結思考 143
參考文獻 143
第12章 多值數據庫或NFNF數據庫 145
簡介 145
12.1 嵌套文件結構 145
12.2 多值係統 147
12.3 NFNF數據庫 149
12.4 現有的錶值擴展 152
12.4.1 Microsoft SQL Server 152
12.4.2 Oracle擴展 153
總結思考 154
第13章 層次數據庫係統和網絡數據庫係統 155
簡介 155
13.1 數據庫類型 155
13.2 數據庫曆史 156
13.2.1 DL/I 157
13.2.2 控製塊 157
13.2.3 數據通信 157
13.2.4 應用程序 157
13.2.5 層次數據庫 158
13.2.6 優勢和劣勢 158
13.3 簡單的層次數據庫 159
13.3.1 Department數據庫 160
13.3.2 Student數據庫 160
13.3.3 設計考量 161
13.3.4 樣例數據庫擴展 161
13.3.5 數據關係 162
13.3.6 層次序列 163
13.3.7 層次數據路徑 163
13.3.8 數據庫記錄 164
13.3.9 段格式 165
13.3.10 段定義 166
13.4 小結 166
總結思考 167
參考文獻 167
術語錶 169
· · · · · · (
收起)