第一部分 基礎篇
第1章 Mahout簡介 2
1.1 Mahout應用背景 2
1.2 Mahout算法庫 3
1.2.1 聚類算法 4
1.2.2 分類算法 5
1.2.3 協同過濾算法 6
1.2.4 頻繁項集挖掘算法 7
1.3 Mahout應用 7
1.4 本章小結 8
第2章 Mahout安裝配置 9
2.1 Mahout安裝前的準備 9
2.1.1 安裝JDK 10
2.1.2 安裝Hadoop 12
2.2 兩種安裝方式 20
2.2.1 使用Maven安裝 20
2.2.2 下載發布版安裝 22
2.3 測試安裝 22
2.4 本章小結 24
第二部分 算法篇
第3章 聚類算法 26
3.1 Canopy算法 26
3.1.1 Canopy算法簡介 26
3.1.2 Mahout中Canopy算法實現原理 28
3.1.3 Mahout的Canopy算法實戰 29
3.1.4 Canopy算法小結 37
3.2 K-Means算法 37
3.2.1 K-Means算法簡介 37
3.2.2 Mahout中K-Means算法實現原理 38
3.2.3 Mahout的K-Means算法實戰 39
3.2.4 K-Means算法小結 46
3.3 Mean Shift算法 46
3.3.1 Mean Shift算法簡介 46
3.3.2 Mahout中Mean Shift算法實現原理 46
3.3.3 Mahout的Mean Shift算法實戰 48
3.3.4 Mean Shift算法小結 51
3.4 本章小結 51
第4章 分類算法 52
4.1 Bayesian算法 53
4.1.1 Bayesian算法簡介 53
4.1.2 Mahout 中Bayesian算法實現原理 55
4.1.3 Mahout的Bayesian算法實戰 59
4.1.4 拓展 70
4.1.5 Bayesian算法小結 70
4.2 Random Forests算法 70
4.2.1 Random Forests算法簡介 70
4.2.2 Mahout中Random Forests算法實現原理 72
4.2.3 Mahout的Random Forests算法實戰 77
4.2.4 拓展 81
4.2.5 Random Forests算法小結 82
4.3 本章小結 83
第5章 協同過濾算法 84
5.1 Distributed Item-Based Collaborative Filtering算法 85
5.1.1 Distributed Item-Based Collaborative Filtering算法簡介 85
5.1.2 Mahout中Distributed ItemBased Collaborative Filtering算法實現原理 86
5.1.3 Mahout的Distributed Item Based Collaborative Filtering算法實戰 90
5.1.4 拓展 93
5.1.5 Distributed ItemBased Collabo-rative Filtering算法小結 94
5.2 Collaborative Filtering with ALSWR算法 94
5.2.1 Collaborative Filtering with ALSWR算法簡介 94
5.2.2 Mahout中Collaborative Filtering with ALS-WR算法實現原理 98
5.2.3 Mahout的Collaborative Filtering with ALS-WR算法實戰 99
5.2.4 拓展 107
5.2.5 Collaborative Filtering with ALSWR算法小結 107
5.3 本章小結 107
第6章 模式挖掘算法 108
6.1 FP樹關聯規則算法 109
6.1.1 FP樹關聯規則算法簡介 109
6.1.2 Mahout中Parallel Frequent Pattern Mining算法實現原理 113
6.1.3 Mahout的Parallel Frequent Pattern Mining算法實戰 120
6.1.4 拓展 125
6.2 本章小結 126
第7章 Mahout中的其他算法 127
7.1 Dimension Reduction算法 128
7.1.1 Dimension Reduction算法簡介 128
7.1.2 Mahout中Dimension Reduction算法實現原理 129
7.1.3 Mahout的Dimension Reduction算法實戰 133
7.1.4 拓展 139
7.2 本章小結 142
第三部分 實戰篇
第8章 Friend Find係統 144
8.1 係統功能 145
8.1.1 係統管理員 145
8.1.2 普通用戶 146
8.1.3 總體功能 146
8.2 數據庫設計 147
8.2.1 原始用戶數據錶 148
8.2.2 注冊用戶數據錶 149
8.2.3 係統管理員錶 149
8.2.4 聚類中心錶 149
8.3 係統技術框架 150
8.4 係統流程 152
8.4.1 登錄 152
8.4.2 注冊 153
8.4.3 上傳數據 154
8.4.4 調用K-Means算法 155
8.4.5 查看用戶分組 157
8.4.6 查看分組情況 158
8.4.7 查看分組成員 159
8.5 係統實現 159
8.5.1 登錄 159
8.5.2 注冊 161
8.5.3 上傳數據 162
8.5.4 調用K-Means算法 163
8.5.5 查看用戶分組 167
8.5.6 查看分組情況 167
8.5.7 查看分組成員 168
8.6 本章小結 170
第9章 Wine Identification係統 171
9.1 係統功能 172
9.1.1 用戶管理模塊 173
9.1.2 隨機森林模型建立模塊 173
9.1.3 隨機森林模型預測模塊 173
9.2 係統框架 173
9.3 數據庫設計 180
9.3.1 用戶錶 180
9.3.2 係統常量錶 181
9.4 係統流程 181
9.4.1 登錄 182
9.4.2 注銷 182
9.4.3 權限修改 182
9.4.4 密碼修改 183
9.4.5 用戶列錶 183
9.4.6 數據上傳 184
9.4.7 隨機森林模型建立 185
9.4.8 隨機森林模型評估 186
9.4.9 隨機森林模型預測 187
9.5 係統實現 188
9.5.1 登錄 188
9.5.2 注銷 188
9.5.3 權限修改 189
9.5.4 密碼修改 190
9.5.5 用戶列錶 191
9.5.6 數據上傳 193
9.5.7 隨機森林模型建立 194
9.5.8 隨機森林模型評估 194
9.5.9 隨機森林模型預測 195
9.6 本章小結 196
第10章 Dating Recommender係統 197
10.1 係統功能 198
10.1.1 係統管理員功能 198
10.1.2 普通用戶功能 199
10.1.3 功能總述 199
10.2 係統框架 200
10.3 數據庫設計 203
10.3.1 係統管理員錶 203
10.3.2 原始用戶推薦信息錶 204
10.3.3 基礎數據top10錶 204
10.4 係統流程 204
10.4.1 登錄 205
10.4.2 上傳數據 205
10.4.3 推薦分析 206
10.4.4 單用戶推薦 210
10.4.5 新用戶推薦 211
10.5 算法設計 214
10.5.1 協同過濾算法接口設計 214
10.5.2 top10算法設計 215
10.5.3 新用戶推薦算法設計 221
10.6 係統實現 228
10.6.1 登錄 228
10.6.2 上傳數據 229
10.6.3 推薦分析 230
10.6.4 單用戶推薦 232
10.6.5 新用戶推薦 234
10.7 本章小結 235
第11章 博客推薦係統 237
11.1 係統功能 238
11.1.1 用戶管理 238
11.1.2 建立知識庫 239
11.1.3 博客管理 239
11.2 係統框架 240
11.3 數據庫設計 246
11.3.1 用戶信息錶 246
11.3.2 知識庫信息錶 247
11.3.3 係統常量錶 248
11.4 係統流程 248
11.4.1 登錄 248
11.4.2 注冊 248
11.4.3 密碼修改 249
11.4.4 訂閱博客查看 249
11.4.5 博客訂閱與退訂 249
11.4.6 博客推薦 250
11.4.7 上傳數據 252
11.4.8 調用FP樹關聯規則算法 253
11.5 算法設計 260
11.6 係統實現 262
11.6.1 登錄 262
11.6.2 注冊 263
11.6.3 密碼修改 264
11.6.4 訂閱博客查看 265
11.6.5 運行FP雲算法 266
11.6.6 博客訂閱與退訂 267
11.6.7 博客推薦 268
11.7 本章小結 270
· · · · · · (
收起)