目 錄
第1章 好的推薦係統 1
1.1 什麼是推薦係統 1
1.2 個性化推薦係統的應用 4
1.2.1 電子商務 4
1.2.2 電影和視頻網站 8
1.2.3 個性化音樂網絡電颱 10
1.2.4 社交網絡 12
1.2.5 個性化閱讀 15
1.2.6 基於位置的服務 16
1.2.7 個性化郵件 17
1.2.8 個性化廣告 18
1.3 推薦係統評測 19
1.3.1 推薦係統實驗方法 20
1.3.2 評測指標 23
1.3.3 評測維度 34
第2章 利用用戶行為數據 35
2.1 用戶行為數據簡介 36
2.2 用戶行為分析 39
2.2.1 用戶活躍度和物品流行度的分布 39
2.2.2 用戶活躍度和物品流行度的關係 41
2.3 實驗設計和算法評測 41
2.3.1 數據集 42
2.3.2 實驗設計 42
2.3.3 評測指標 42
2.4 基於鄰域的算法 44
2.4.1 基於用戶的協同過濾算法 44
2.4.2 基於物品的協同過濾算法 51
2.4.3 UserCF和ItemCF的綜閤比較 59
2.5 隱語義模型 64
2.5.1 基礎算法 64
2.5.2 基於LFM的實際係統的例子 70
2.5.3 LFM和基於鄰域的方法的比較 72
2.6 基於圖的模型 73
2.6.1 用戶行為數據的二分圖錶示 73
2.6.2 基於圖的推薦算法 73
第3章 推薦係統冷啓動問題 78
3.1 冷啓動問題簡介 78
3.2 利用用戶注冊信息 79
3.3 選擇閤適的物品啓動用戶的興趣 85
3.4 利用物品的內容信息 89
3.5 發揮專傢的作用 94
第4章 利用用戶標簽數據 96
4.1 UGC標簽係統的代錶應用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 標簽係統中的推薦問題 100
4.2.1 用戶為什麼進行標注 100
4.2.2 用戶如何打標簽 101
4.2.3 用戶打什麼樣的標簽 102
4.3 基於標簽的推薦係統 103
4.3.1 實驗設置 104
4.3.2 一個最簡單的算法 105
4.3.3 算法的改進 107
4.3.4 基於圖的推薦算法 110
4.3.5 基於標簽的推薦解釋 112
4.4 給用戶推薦標簽 115
4.4.1 為什麼要給用戶推薦標簽 115
4.4.2 如何給用戶推薦標簽 115
4.4.3 實驗設置 116
4.4.4 基於圖的標簽推薦算法 119
4.5 擴展閱讀 119
第5章 利用上下文信息 121
5.1 時間上下文信息 122
5.1.1 時間效應簡介 122
5.1.2 時間效應舉例 123
5.1.3 係統時間特性的分析 125
5.1.4 推薦係統的實時性 127
5.1.5 推薦算法的時間多樣性 128
5.1.6 時間上下文推薦算法 130
5.1.7 時間段圖模型 134
5.1.8 離綫實驗 136
5.2 地點上下文信息 139
5.3 擴展閱讀 143
第6章 利用社交網絡數據 144
6.1 獲取社交網絡數據的途徑 144
6.1.1 電子郵件 145
6.1.2 用戶注冊信息 146
6.1.3 用戶的位置數據 146
6.1.4 論壇和討論組 146
6.1.5 即時聊天工具 147
6.1.6 社交網站 147
6.2 社交網絡數據簡介 148社交網絡數據中的長尾分布 149
6.3 基於社交網絡的推薦 150
6.3.1 基於鄰域的社會化推薦算法 151
6.3.2 基於圖的社會化推薦算法 152
6.3.3 實際係統中的社會化推薦算法 153
6.3.4 社會化推薦係統和協同過濾推薦係統 155
6.3.5 信息流推薦 156
6.4 給用戶推薦好友 159
6.4.1 基於內容的匹配 161
6.4.2 基於共同興趣的好友推薦 161
6.4.3 基於社交網絡圖的好友推薦 161
6.4.4 基於用戶調查的好友推薦算法對比 164
6.5 擴展閱讀 165
第7章 推薦係統實例 166
7.1 外圍架構 166
7.2 推薦係統架構 167
7.3 推薦引擎的架構 171
7.3.1 生成用戶特徵嚮量 172
7.3.2 特徵?物品相關推薦 173
7.3.3 過濾模塊 174
7.3.4 排名模塊 174
7.4 擴展閱讀 178
第8章 評分預測問題 179
8.1 離綫實驗方法 180
8.2 評分預測算法 180
8.2.1 平均值 180
8.2.2 基於鄰域的方法 184
8.2.3 隱語義模型與矩陣分解模型 186
8.2.4 加入時間信息 192
8.2.5 模型融閤 193
8.2.6 Netflix Prize的相關實驗結果 195
後記 196
· · · · · · (
收起)
評分
☆☆☆☆☆
算法掃盲讀物,介紹瞭互聯網産品中與推薦相關的大部分基礎知識與思路。推薦給工程師和産品經理們
評分
☆☆☆☆☆
入門級
評分
☆☆☆☆☆
:TP393/1090
評分
☆☆☆☆☆
充分照顧瞭我的智商
評分
☆☆☆☆☆
推薦係統學習入門。豆瓣在很多部分都被當例子說明瞭。最近用淘寶之類的,也會留意其推薦的東西。有些推薦真是渣啊,明明點瞭不喜歡,還一直推薦。看來算法還需再優化。
評分
☆☆☆☆☆
这只是一本197页的书 我想你未必过瘾 但作者附上了诸多好资料 无论是paper, blog文章,wikipedia词条,数据集还是开源项目等 你可以选择拥有 附上我收集的资料链接,格式基本按照‘URL+资料名称+出现在书中的页数’,某些链接可能需要你翻过一道‘墙’,某些重复引用的...
評分
☆☆☆☆☆
評分
☆☆☆☆☆
什么是推荐系统?从网易云音乐的热门排行榜,到亚马逊的首页推荐,可以说他们都是推荐系统。区别在于,前者是大众推荐,而后者是个性化推荐。 早期的媒体关注的是大众兴趣,电视上的节目频道寥寥无几的时候,其内容总是会迎合大部分观众的兴趣,新闻、娱乐八卦、电视剧,虽然...
評分
☆☆☆☆☆
书中低级错误遍地都是,尤其是代码 ,不看代码凑和着能看懂点东西(行文错误有的可以猜个大概),一看代码就凌乱了……上下文中用的变量名字不一致,中间有的自己的函数只有一个函数名,没有函数体,作者是想让我们猜呢?还是想让我们猜呢???尤其是68页的LFM的代码更是惨不...
評分
☆☆☆☆☆