目 录
第1章 好的推荐系统 1
1.1 什么是推荐系统 1
1.2 个性化推荐系统的应用 4
1.2.1 电子商务 4
1.2.2 电影和视频网站 8
1.2.3 个性化音乐网络电台 10
1.2.4 社交网络 12
1.2.5 个性化阅读 15
1.2.6 基于位置的服务 16
1.2.7 个性化邮件 17
1.2.8 个性化广告 18
1.3 推荐系统评测 19
1.3.1 推荐系统实验方法 20
1.3.2 评测指标 23
1.3.3 评测维度 34
第2章 利用用户行为数据 35
2.1 用户行为数据简介 36
2.2 用户行为分析 39
2.2.1 用户活跃度和物品流行度的分布 39
2.2.2 用户活跃度和物品流行度的关系 41
2.3 实验设计和算法评测 41
2.3.1 数据集 42
2.3.2 实验设计 42
2.3.3 评测指标 42
2.4 基于邻域的算法 44
2.4.1 基于用户的协同过滤算法 44
2.4.2 基于物品的协同过滤算法 51
2.4.3 UserCF和ItemCF的综合比较 59
2.5 隐语义模型 64
2.5.1 基础算法 64
2.5.2 基于LFM的实际系统的例子 70
2.5.3 LFM和基于邻域的方法的比较 72
2.6 基于图的模型 73
2.6.1 用户行为数据的二分图表示 73
2.6.2 基于图的推荐算法 73
第3章 推荐系统冷启动问题 78
3.1 冷启动问题简介 78
3.2 利用用户注册信息 79
3.3 选择合适的物品启动用户的兴趣 85
3.4 利用物品的内容信息 89
3.5 发挥专家的作用 94
第4章 利用用户标签数据 96
4.1 UGC标签系统的代表应用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 标签系统中的推荐问题 100
4.2.1 用户为什么进行标注 100
4.2.2 用户如何打标签 101
4.2.3 用户打什么样的标签 102
4.3 基于标签的推荐系统 103
4.3.1 实验设置 104
4.3.2 一个最简单的算法 105
4.3.3 算法的改进 107
4.3.4 基于图的推荐算法 110
4.3.5 基于标签的推荐解释 112
4.4 给用户推荐标签 115
4.4.1 为什么要给用户推荐标签 115
4.4.2 如何给用户推荐标签 115
4.4.3 实验设置 116
4.4.4 基于图的标签推荐算法 119
4.5 扩展阅读 119
第5章 利用上下文信息 121
5.1 时间上下文信息 122
5.1.1 时间效应简介 122
5.1.2 时间效应举例 123
5.1.3 系统时间特性的分析 125
5.1.4 推荐系统的实时性 127
5.1.5 推荐算法的时间多样性 128
5.1.6 时间上下文推荐算法 130
5.1.7 时间段图模型 134
5.1.8 离线实验 136
5.2 地点上下文信息 139
5.3 扩展阅读 143
第6章 利用社交网络数据 144
6.1 获取社交网络数据的途径 144
6.1.1 电子邮件 145
6.1.2 用户注册信息 146
6.1.3 用户的位置数据 146
6.1.4 论坛和讨论组 146
6.1.5 即时聊天工具 147
6.1.6 社交网站 147
6.2 社交网络数据简介 148社交网络数据中的长尾分布 149
6.3 基于社交网络的推荐 150
6.3.1 基于邻域的社会化推荐算法 151
6.3.2 基于图的社会化推荐算法 152
6.3.3 实际系统中的社会化推荐算法 153
6.3.4 社会化推荐系统和协同过滤推荐系统 155
6.3.5 信息流推荐 156
6.4 给用户推荐好友 159
6.4.1 基于内容的匹配 161
6.4.2 基于共同兴趣的好友推荐 161
6.4.3 基于社交网络图的好友推荐 161
6.4.4 基于用户调查的好友推荐算法对比 164
6.5 扩展阅读 165
第7章 推荐系统实例 166
7.1 外围架构 166
7.2 推荐系统架构 167
7.3 推荐引擎的架构 171
7.3.1 生成用户特征向量 172
7.3.2 特征?物品相关推荐 173
7.3.3 过滤模块 174
7.3.4 排名模块 174
7.4 扩展阅读 178
第8章 评分预测问题 179
8.1 离线实验方法 180
8.2 评分预测算法 180
8.2.1 平均值 180
8.2.2 基于邻域的方法 184
8.2.3 隐语义模型与矩阵分解模型 186
8.2.4 加入时间信息 192
8.2.5 模型融合 193
8.2.6 Netflix Prize的相关实验结果 195
后记 196
· · · · · · (
收起)
评分
☆☆☆☆☆
像我这种入门级别的看完还是能理清很多之前见过,但没有很清晰见解的人,不过还是需要给别人讲 PPT 和讨论,才能发现自己是否真的理解了。
评分
☆☆☆☆☆
作者会写代码吗?就没几行是对的。
评分
☆☆☆☆☆
系统性地介绍了这一领域,思路清晰,读完挺有收获的。看起来推荐的中主要难点在架构和策略上,算法都比较简单。
评分
☆☆☆☆☆
三星给内容,一星给启发式讲解
评分
☆☆☆☆☆
推荐引擎入门
评分
☆☆☆☆☆
这本书是我学习推荐系统以来接触的第一本书,书是好书,作者为了写出像《集体编程智慧》那样实用的手册还是很下了番功夫,值得肯定,特别是作者还是国内的,就更要推荐了。 从入门的角度看,本书页数不多,不会让人望而却步,第一张的引入也写的确实让人很有兴趣,之后每个章节...
评分
☆☆☆☆☆
刚看书看到一半的时候我曾经在短评中吐槽说,这书中的python代码可以直接去掉的,事实也确实如此,然后公式中有些变量没有注释的事情也是出现在前半部分,感觉书的后半部分要比前半部分写的严谨多了,不知道前半部分是谁写的= =!。 书的序言里写到作者想要把这本书写成像集体...
评分
☆☆☆☆☆
总体讲得粗略没什么细节上的干货 现成的推荐算法,评估算法的库很多感觉没啥必要重复造轮子 没有一个完整项目实施的过程 如果说是入门书的话我觉得看几篇相关博客还比较快 要说深度……基本没有 书前面一堆商业互吹的序言,略失望 上面已经是全部书评了……但是豆瓣要求书评到1...
评分
☆☆☆☆☆
这种贴代码的讲解方法只学到了《集体智慧编程》的一半,这里仅仅是简单的张贴出来代码,却没有给出在Python的交互式环境下运行结果,这样会让读者很疑惑,只能够整段整段的跳过代码不看了。如果还有下一版的话希望能够改进,否则很多代码里面包含了一些错误都不能够被辨别出来。
评分
☆☆☆☆☆
2009年8月,我和项亮一起发起了 ResysChina —— 一个面向推荐系统领域的专业社区。建立初衷,是想为业内关注推荐系统领域的朋友提供一个交流讨论的社区。迄今为止,业内朋友给予了 ResysChina 热情的鼓励与支持,我们组织了多次线下分享会,在嘉宾们为大家带来精彩观点的同时...