第一部分 通用流程
第 1章 問題建模 2
1.1 評估指標 3
1.1.1 分類指標 4
1.1.2 迴歸指標 7
1.1.3 排序指標 9
1.2 樣本選擇 10
1.2.1 數據去噪 11
1.2.2 采樣 12
1.2.3 原型選擇和訓練集選擇 13
1.3 交叉驗證 14
1.3.1 留齣法 14
1.3.2 K摺交叉驗證 15
1.3.3 自助法 16
參考文獻 17
第 2章 特徵工程 18
2.1 特徵提取 18
2.1.1 探索性數據分析 19
2.1.2 數值特徵 20
2.1.3 類彆特徵 22
2.1.4 時間特徵 24
2.1.5 空間特徵 25
2.1.6 文本特徵 25
2.2 特徵選擇 27
2.2.1 過濾方法 28
2.2.2 封裝方法 31
2.2.3 嵌入方法 31
2.2.4 小結 32
2.2.5 工具介紹 33
參考文獻 33
第3章 常用模型 35
3.1 邏輯迴歸 35
3.1.1 邏輯迴歸原理 35
3.1.2 邏輯迴歸應用 38
3.2 場感知因子分解機 39
3.2.1 因子分解機原理 39
3.2.2 場感知因子分解機原理 40
3.2.3 場感知因子分解機的應用 41
3.3 梯度提升樹 42
3.3.1 梯度提升樹原理 42
3.3.2 梯度提升樹的應用 44
參考文獻 44
第4章 模型融閤 45
4.1 理論分析 46
4.1.1 融閤收益 46
4.1.2 模型誤差 分歧分解 46
4.1.3 模型多樣性度量 48
4.1.4 多樣性增強 49
4.2 融閤方法 50
4.2.1 平均法 50
4.2.2 投票法 52
4.2.3 Bagging 54
4.2.4 Stacking 55
4.2.5 小結 56
參考文獻 57
第二部分 數據挖掘
第5章 用戶畫像 60
5.1 什麼是用戶畫像 60
5.2 用戶畫像數據挖掘 63
5.2.1 畫像數據挖掘整體架構 63
5.2.2 用戶標識 65
5.2.3 特徵數據 67
5.2.4 樣本數據 68
5.2.5 標簽建模 69
5.3 用戶畫像應用 83
5.3.1 用戶畫像實時查詢係統 83
5.3.2 人群畫像分析係統 87
5.3.3 其他係統 90
5.3.4 綫上應用效果 91
5.4 小結 91
參考文獻 91
第6章 POI實體鏈接 92
6.1 問題的背景與難點 92
6.2 國內酒店POI實體鏈接解決方案 94
6.2.1 酒店POI實體鏈接 94
6.2.2 數據清洗 96
6.2.3 特徵生成 97
6.2.4 模型選擇與效果評估 100
6.2.5 索引粒度的配置 101
6.3 其他場景的策略調整 101
6.4 小結 103
第7章 評論挖掘 104
7.1 評論挖掘的背景 104
7.1.1 評論挖掘的粒度 105
7.1.2 評論挖掘的維度 105
7.1.3 評論挖掘的整閤思考 106
7.2 評論標簽提取 106
7.2.1 數據的獲取及預處理 107
7.2.2 無監督的標簽提取方法 109
7.2.3 基於深度學習的標簽提取方法 111
7.3 標簽情感分析 113
7.3.1 評論標簽情感分析的特殊性 113
7.3.2 基於深度學習的情感分析方法 115
7.3.3 評論標簽情感分析的後續優 化與思考 118
7.4 評論挖掘的未來應用及實踐 119
7.5 小結 119
參考文獻 119
第三部分 搜索和推薦
第8章 O2O場景下的查詢理解與 用戶引導 122
8.1 現代搜索引擎原理 123
8.2 精確理解查詢 124
8.2.1 用戶查詢意圖的定義與識彆 125
8.2.2 查詢實體識彆與結構化 129
8.2.3 召迴策略的變遷 130
8.2.4 查詢改寫 131
8.2.5 詞權重與相關性計算 134
8.2.6 類目相關性與人工標注 135
8.2.7 查詢理解小結 136
8.3 引導用戶完成搜索 137
8.3.1 用戶引導的産品定義與衡量 標準 137
8.3.2 搜索前的引導——查詢詞 推薦 140
8.3.3 搜索中的引導——查詢補全 143
8.3.4 搜索後的引導——相關搜索 145
8.3.5 效率提升與效果提升 145
8.3.6 用戶引導小結 149
8.4 小結 149
參考文獻 150
第9章 O2O場景下排序的特點 152
9.1 係統概述 154
9.2 在綫排序服務 154
9.3 多層正交A/B測試 155
9.4 特徵獲取 155
9.5 離綫調研係統 156
9.6 特徵工程 156
9.7 排序模型 157
9.8 場景化排序 160
9.9 小結 165
第 10章 推薦在O2O場景的應用 166
10.1 典型的O2O推薦場景 166
10.2 O2O推薦場景特點 167
10.2.1 O2O場景的地理位置因素 168
10.2.2 O2O場景的用戶曆史行為 168
10.2.3 O2O場景的實時推薦 169
10.3 美團推薦實踐——推薦框架 169
10.4 美團推薦實踐——推薦召迴 170
10.4.1 基於協同過濾的召迴 171
10.4.2 基於位置的召迴 171
10.4.3 基於搜索查詢的召迴 172
10.4.4 基於圖的召迴 172
10.4.5 基於實時用戶行為的召迴 172
10.4.6 替補策略 172
10.5 美團推薦實踐——推薦排序 173
10.5.1 排序特徵 173
10.5.2 排序樣本 174
10.5.3 排序模型 175
10.6 推薦評價指標 176
參考文獻 176
第四部分 計算廣告
第 11章 O2O場景下的廣告營銷 178
11.1 O2O場景下的廣告業務特點 178
11.2 商戶、用戶和平颱三者利益平衡 180
11.2.1 商戶效果感知 180
11.2.2 用戶體驗 181
11.2.3 平颱收益 182
11.3 O2O廣告機製設計 183
11.3.1 廣告位設定 183
11.3.2 廣告召迴機製 183
11.3.3 廣告排序機製 184
11.4 O2O推送廣告 187
11.5 O2O廣告係統工具 190
11.5.1 麵嚮開發人員的係統工具 190
11.5.2 麵嚮廣告主和運營人員的 工具 192
11.6 小結 194
參考文獻 194
第 12章 用戶偏好和損失建模 196
12.1 如何定義用戶偏好 196
12.1.1 什麼是用戶偏好 196
12.1.2 如何衡量用戶偏好 196
12.1.3 對不同POI 的偏好 197
12.1.4 用戶對 POI 偏好的衡量 197
12.2 廣告價值與偏好損失的兌換 198
12.2.1 優化目標 199
12.2.2 模型建模 199
12.3 Pairwise 模型學習 201
12.3.1 GBRank 202
12.3.2 RankNet 204
參考文獻 205
第五部分 深度學習
第 13章 深度學習概述 208
13.1 深度學習技術發展曆程 209
13.2 深度學習基礎結構 211
13.3 深度學習研究熱點 216
13.3.1 基於深度學習的生成式模型 216
13.3.2 深度強化學習 218
參考文獻 219
第 14章 深度學習在文本領域的應用 220
14.1 基於深度學習的文本匹配 221
14.2 基於深度學習的排序模型 231
14.2.1 排序模型簡介 231
14.2.2 深度學習排序模型的演進 232
14.2.3 美團的深度學習排序模型 嘗試 235
14.3 小結 237
參考文獻 237
第 15章 深度學習在計算機視覺中的 應用 238
15.1 基於深度學習的OCR 238
15.1.1 OCR技術發展曆程 239
15.1.2 基於深度學習的文字檢測 244
15.1.3 基於序列學習的文字識彆 248
15.1.4 小結 251
15.2 基於深度學習的圖像智能審核 251
15.2.1 基於深度學習的水印檢測 252
15.2.2 明星臉識彆 254
15.2.3 色情圖片檢測 257
15.2.4 場景分類 257
15.3 基於深度學習的圖像質量排序 259
15.3.1 圖像美學質量評價 260
15.3.2 麵嚮點擊預測的圖像質量 評價 260
15.4 小結 263
參考文獻 264
第六部分 算法工程
第 16章 大規模機器學習 268
16.1 並行計算編程技術 268
16.1.1 嚮量化 269
16.1.2 多核並行OpenMP 270
16.1.3 GPU編程 272
16.1.4 多機並行MPI 273
16.1.5 並行編程技術小結 276
16.2 並行計算模型 276
16.2.1 BSP 277
16.2.2 SSP 279
16.2.3 ASP 280
16.2.4 參數服務器 281
16.3 並行計算案例 284
16.3.1 XGBoost並行庫Rabit 284
16.3.2 MXNet並行庫PS-Lite 286
16.4 美團並行計算機器學習平颱 287
參考文獻 289
第 17章 特徵工程和實驗平颱 290
17.1 特徵平颱 290
17.1.1 特徵生産 290
17.1.2 特徵上綫 293
17.1.3 在綫特徵監控 301
17.2 實驗管理平颱 302
17.2.1 實驗平颱概述 302
17.2.2 美團實驗平颱——Gemini 304
· · · · · · (
收起)