本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
本书是Web开发者、架构师、应用工程师等的绝佳选择。
Toby Segaran是Genstruct公司的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。Toby Segaran还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,Toby Segaran还建立了几个免费的网站应用,包括流行的tasktoy和Lazybase。他非常喜欢滑雪与品酒,其博客地址是blog.kiwitobes.com,现居于旧金山。
可能不是什么最新的研究热点 不过就读完第一章之后来看,基本上验证了我之前对于协同过滤方面的知识,并且感觉可以作为后续研究的一个指导和激励。 看到后面的章节内容,支持向量机,神经网络等之前在工程上用的少之又少的东西都能有它们的用武之地,让人相当之兴奋。 其实目前...
评分好书,介绍一些常用算法的使用方法,如神经网络,支持向量机,模拟退火,遗传算法等.对普通读者已经够了.能将这些算法用熟,就能开发出非常好的应用程序来。 缺少当今最流行的小波和独立分量分析,当然不可能有最新的变分贝叶斯理论.对研究算法且用于应用开发的人来说可以是一个好实...
评分来自guwendong的书评,贴上来供大家参考。 中国有句老话,叫做“知易行难”。 作算法的朋友应该更有体会,想把 paper 上的公式转变为可以运行的代码,这是件考验功力的事情。 Toby Segaran 写的这本《Programming Collective Intelligence》,是修炼此种功力的武林秘笈之一。 ...
评分 评分看了没几页,就有醍醐灌顶的感觉,一起很多迷茫的问题都清晰了不少。相信看完并理解好了之后一定会功力大增
里头有些代码实现略糙。
评分里头有些代码实现略糙。
评分翻译减分,有很多句子在原文里清晰简单,被翻译得莫名其妙。作者这种从零开始自己写决策树的精神是很伟大的,值得学习。
评分里头有些代码实现略糙。
评分这本书,前几章看着还可以,觉得学到了点东西,到了后面完全不知道在说什么了,只告诉你怎么做却不告诉你为什么要这样做,套公式
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有