推薦係統算法實踐

推薦係統算法實踐 pdf epub mobi txt 電子書 下載2025

出版者:電子工業齣版社
作者:黃美靈 著
出品人:博文視點
頁數:356页
译者:
出版時間:2019-9
價格:89.00元
裝幀:平裝
isbn號碼:9787121370403
叢書系列:博文視點AI係列
圖書標籤:
  • 推薦係統
  • 算法
  • 計算機
  • 程序設計
  • 産品經理
  • 技術通識
  • 大數據
  • 互聯網
  • 推薦係統
  • 算法
  • 實踐
  • 機器學習
  • 數據挖掘
  • Python
  • 個性化推薦
  • 協同過濾
  • 深度學習
  • 用戶行為分析
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

《推薦係統算法實踐》主要講解推薦係統中的召迴算法和排序算法,以及各個算法在主流工具Sklearn、Spark、TensorFlow等中的實現和應用。

《推薦係統算法實踐》中本著循序漸進的原則進行講解。首先,介紹推薦係統中推薦算法的數學基礎,推薦算法的平颱、工具基礎,以及具體的推薦係統。其次,講解推薦係統中的召迴算法,主要包括基於行為相似的協同過濾召迴和基於內容相似的Word2vec召迴,並且介紹其在Spark、TensorFlow主流工具中的實現與應用。再次,講解推薦係統中的排序算法,包括綫性模型、樹模型和深度學習模型,分彆介紹邏輯迴歸、FM、決策樹、隨機森林、GBDT、GBDT+LR、集成學習、深度森林、DNN、Wide & Deep、DeepFM、YouTube推薦等模型的原理,以及其在Sklearn、Spark、TensorFlow主流工具中的實現與應用。最後,介紹推薦算法的4個實踐案例,幫助讀者進行工程實踐和應用,並且介紹如何在Notebook上進行代碼開發和算法調試,以幫助讀者提升工作效率。

《推薦係統算法實踐》適閤AI、數據挖掘、大數據等領域的從業人員閱讀,書中為開發者展現瞭推薦算法的原理、實現與應用案例。

著者簡介

黃美靈

現任一綫互聯網公司的高級工程師,擁有多年大型互聯網公司推薦係統和機器學習實戰經驗,現從事廣告推薦、應用分發和資訊Feeds流推薦相關工作。

圖書目錄

第1部分 推薦係統的算法基礎
第1章 數學基礎 2
1.1 綫性代數 2
1.2 概率與統計 5
1.3 損失函數 7
1.4 優化方法 8
1.4.1 SGD 8
1.4.2 動量 8
1.4.3 Nesterov動量 9
1.4.4 AdaGrad 9
1.4.5 Adam 10
1.4.6 L-BFGS 10
1.4.7 梯度法和牛頓法的比較 11
1.5 評價方法 11
1.5.1 混淆矩陣 11
1.5.2 ROC麯綫 13
第2章 推薦係統介紹 17
2.1 推薦係統背景 17
2.2 推薦係統的典型案例 18
2.2.1 Amazon推薦 19
2.2.2 Facebook推薦 21
2.2.3 YouTube推薦 22
2.3 推薦係統原理 23
第3章 推薦算法工具 26
3.1 Python Sklearn機器學習庫 26
3.1.1 Sklearn介紹 26
3.1.2 Sklearn建模流程 27
3.2 Spark MLlib機器學習庫 28
3.2.1 MLlib介紹 28
3.2.2 MLlib建模流程 29
3.3 TensorFlow 31
3.3.1 TensorFlow介紹 31
3.3.2 TensorFlow建模流程 31
3.4 Notebook介紹 32
3.4.1 Zeppelin Notebook介紹 32
3.4.2 Jupyter Notebook介紹 36
第2部分 推薦係統的召迴算法
第4章 協同過濾——基於行為相似的召迴 40
4.1 協同過濾算法 40
4.1.1 協同過濾推薦概述 40
4.1.2 用戶評分 41
4.1.3 相似度計算 41
4.1.4 推薦計算 43
4.2 協同過濾推薦算法實現 44
4.2.1 相似度計算及推薦計算 47
4.2.2 協同推薦 54
4.2.3 運行結果 59
第5章 Word2vec——基於內容相似的召迴 65
5.1 Word2vec算法 65
5.1.1 語言模型 65
5.1.2 CBOW One-Word Context模型 66
5.1.3 CBOW Multi-Word Context 模型 71
5.1.4 Skip-Gram模型 72
5.1.5 Hierarchical Softmax 74
5.1.6 Negative Sampling 74
5.2 Word2vec實例 75
5.2.1 Spark實現 75
5.2.2 TensorFlow實現 80
第3部分 推薦係統的排序算法——綫性模型
第6章 邏輯迴歸 86
6.1 邏輯迴歸算法 86
6.1.1 二元邏輯迴歸模型 86
6.1.2 模型參數估計 88
6.1.3 多元邏輯迴歸模型(Softmax迴歸) 88
6.1.4 邏輯迴歸的網絡結構 89
6.1.5 梯度下降算法 90
6.1.6 正則化 91
6.2 邏輯迴歸實現 93
6.2.1 Sklearn實現 93
6.2.2 Spark實現 98
6.2.3 TensorFlow實現 108
6.2.4 效果總結 114
第7章 因子分解機(FM) 115
7.1 FM算法 115
7.1.1 FM模型 115
7.1.2 FFM模型 118
7.1.3 FM模型的網絡結構 119
7.2 FM實現 120
7.2.1 Sklearn實現 120
7.2.2 TensorFlow實現 122
7.2.3 效果總結 128
第4部分 推薦係統的排序算法——樹模型
第8章 決策樹 130
8.1 決策樹算法 130
8.1.1 決策樹模型 130
8.1.2 特徵選擇 131
8.1.3 決策樹的生成 133
8.1.4 決策樹的生成實例 134
8.1.5 決策樹的剪枝 135
8.2 決策樹的集成算法 136
8.2.1 集成分類器 136
8.2.2 隨機森林 137
8.2.3 GBDT 137
8.3 決策樹集成算法實例 139
8.3.1 Spark實現 139
8.3.2 Sklearn實現 149
8.3.3 效果總結 154
第9章 集成學習 155
9.1 GBDT+LR算法 155
9.1.1 背景 155
9.1.2 GBDT+LR網絡結構 156
9.2 深度森林算法 159
9.2.1 深度森林介紹 159
9.2.2 級聯森林 160
9.2.3 多粒度掃描 161
9.3 決策樹集成分類器 162
9.4 集成學習實例 164
9.4.1 GBDT+LR實現 164
9.4.2 深度森林實現 167
9.4.3 效果總結 175
第5部分 推薦係統的排序算法——深度學習模型
第10章 深度學習在推薦算法中的應用 178
10.1 推薦模型的特點 178
10.2 基於深度學習的推薦模型 179
10.2.1 DNN優化高階特徵 179
10.2.2 高階特徵交叉與低階特徵交叉 181
10.2.3 特徵交叉優化 183
10.2.4 特徵連接優化 184
10.2.5 高階特徵交叉優化 185
10.2.6 多樣性的深度興趣特徵優化 186
第11章 DNN算法 189
11.1 人工神經網絡算法 189
11.1.1 神經元 189
11.1.2 神經網絡模型 191
11.1.3 信號的前嚮傳播 191
11.1.4 誤差的反嚮傳播 193
11.2 DNN優化方法 195
11.2.1 優化參數 196
11.2.2 Attention機製 197
11.3 DNN實例 198
11.4 運行結果 205
第12章 Wide & Deep模型 206
12.1 Wide & Deep模型概述 206
12.1.1 Wide模型 208
12.1.2 Deep模型 209
12.1.3 模型聯閤訓練 210
12.2 Wide & Deep係統實現 211
12.2.1 推薦係統介紹 211
12.2.2 係統流程 212
12.2.3 訓練數據的生成 213
12.2.4 模型訓練 213
12.2.5 綫上應用 214
12.3 Wide & Deep實例 214
12.4 運行結果 219
第13章 DeepFM模型 225
13.1 DeepFM模型概述 225
13.1.1 FM組件 226
13.1.2 Deep組件 228
13.1.3 模型對比 229
13.2 DeepFM模型實例 231
13.3 運行結果 241
第14章 YouTube的深度神經網絡模型 243
14.1 YouTube推薦模型 243
14.1.1 背景介紹 243
14.1.2 召迴模型設計 245
14.1.3 排序模型設計 250
14.2 YouTube實例 252
14.3 運行結果 256
第6部分 推薦係統的算法實踐
第15章 實踐——基於電商平颱的商品召迴 260
15.1 背景介紹 260
15.2 模型選擇 261
15.3 算法開發 261
第16章 實踐——基於邏輯迴歸的音樂評分預測 266
16.1 背景介紹 266
16.2 數據準備 266
16.3 特徵處理 268
16.4 模型選擇 270
16.5 算法開發 271
第17章 實踐——Kaggle競賽之Outbrain點擊率預估 275
17.1 背景介紹 275
17.2 數據準備 277
17.3 特徵處理 283
17.4 模型選擇 284
17.4.1 FFM 285
17.4.2 XGBoost 288
17.4.3 集成學習 292
17.5 算法開發 292
第18章 實踐——基於深度學習的電商商品點擊率預估 297
18.1 背景介紹 297
18.2 數據準備 298
18.3 特徵處理 302
18.4 模型選擇 303
18.5 算法開發 304
18.6 運行結果 309
第19章 Notebook實踐 312
19.1 Sklearn中的LR實踐 312
19.2 TensorFlow中的LR實踐 316
19.3 Spark中的LR實踐 321
19.4 TensorFlow中的FM調試實踐 327
19.5 Spark中的協同過濾調試實踐 331
· · · · · · (收起)

讀後感

評分

这本书看起来是真累,写的云里雾里。好多评论说适合小白,我并不这么认为。 因为该重点写的地方,一个公式放在那里,这对于小白来讲很痛苦。 看到这本书,觉得好厚,千万不要害怕,因为里面代码太多了,真的!并且算法实现前面是用spark,后面是用Python,如果单纯粘贴复制网上...  

評分

这本书看起来是真累,写的云里雾里。好多评论说适合小白,我并不这么认为。 因为该重点写的地方,一个公式放在那里,这对于小白来讲很痛苦。 看到这本书,觉得好厚,千万不要害怕,因为里面代码太多了,真的!并且算法实现前面是用spark,后面是用Python,如果单纯粘贴复制网上...  

評分

这本书看起来是真累,写的云里雾里。好多评论说适合小白,我并不这么认为。 因为该重点写的地方,一个公式放在那里,这对于小白来讲很痛苦。 看到这本书,觉得好厚,千万不要害怕,因为里面代码太多了,真的!并且算法实现前面是用spark,后面是用Python,如果单纯粘贴复制网上...  

評分

这本书看起来是真累,写的云里雾里。好多评论说适合小白,我并不这么认为。 因为该重点写的地方,一个公式放在那里,这对于小白来讲很痛苦。 看到这本书,觉得好厚,千万不要害怕,因为里面代码太多了,真的!并且算法实现前面是用spark,后面是用Python,如果单纯粘贴复制网上...  

評分

这本书看起来是真累,写的云里雾里。好多评论说适合小白,我并不这么认为。 因为该重点写的地方,一个公式放在那里,这对于小白来讲很痛苦。 看到这本书,觉得好厚,千万不要害怕,因为里面代码太多了,真的!并且算法实现前面是用spark,后面是用Python,如果单纯粘贴复制网上...  

用戶評價

评分

代碼基本都是scala的 很多代碼很多都省略瞭 算法總結的挺全麵的,雖然有些寫的不是很詳細但是對於入門來說還是挺好的 再詳細些的需要自己找論文去看瞭

评分

整本書比較垃圾,知識都比較淺顯,該重要的地方沒寫;不重要的代碼和結構占據40%,作者可能是想要全麵吧,啥代碼都放上去sklearn,spark,tensorflow,給人的感覺就是復製粘貼上去的。主要是代碼還沒有數據!沒有數據!沒有數據!(重要的事情說三遍!)沒有數據作者你放代碼的結果乾嘛?你說你這不是注水你自己信嗎?講個word2vec都講不清楚,分層soft,負采樣這麼多的知識點,你一頁紙三兩句話就寫完瞭。你逗我呢? 唯一的好處是:內容淺顯比較全麵吧,建議新手自己擴充知識麵。

评分

注水嚴重,代碼占瞭很大篇幅,算法講解,很多網上扒的,不過至少給我這種小白選手一些啓發和思路。但是兩三句能講明白的東西,非要拉的很長。這個可能為瞭湊篇幅吧,總體還好,適閤入門。

评分

代碼基本都是scala的 很多代碼很多都省略瞭 算法總結的挺全麵的,雖然有些寫的不是很詳細但是對於入門來說還是挺好的 再詳細些的需要自己找論文去看瞭

评分

提供的代碼邏輯性不夠強,省略瞭對數據的處理過程,對閱讀會産生不小的障礙。可通過閱讀此書初步瞭解推薦係統的主流算法,但對實踐復現代碼的過程並不友好。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有