Mining of Massive Datasets

Mining of Massive Datasets pdf epub mobi txt 電子書 下載2025

出版者:Cambridge University Press
作者:Anand Rajaraman
出品人:
頁數:326
译者:
出版時間:2011-12-30
價格:USD 65.00
裝幀:Hardcover
isbn號碼:9781107015357
叢書系列:
圖書標籤:
  • 數據挖掘
  • 大規模數據處理
  • 機器學習
  • Mining
  • 計算機
  • DataMining
  • 推薦係統
  • 人工智能
  • 數據挖掘
  • 大數據
  • 機器學習
  • 算法
  • 數據庫
  • 統計學
  • 人工智能
  • 模式識彆
  • 數據科學
  • 數據處理
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

The popularity of the Web and Internet commerce provides many extremely large datasets from which information can be gleaned by data mining. This book focuses on practical algorithms that have been used to solve key problems in data mining and which can be used on even the largest datasets. It begins with a discussion of the map-reduce framework, an important tool for parallelizing algorithms automatically. The authors explain the tricks of locality-sensitive hashing and stream processing algorithms for mining data that arrives too fast for exhaustive processing. The PageRank idea and related tricks for organizing the Web are covered next. Other chapters cover the problems of finding frequent itemsets and clustering. The final chapters cover two applications: recommendation systems and Web advertising, each vital in e-commerce. Written by two authorities in database and Web technologies, this book is essential reading for students and practitioners alike.

著者簡介

Anand Rajaraman 數據庫和Web技術領域權威,創業投資基金Cambrian聯閤創始人,斯坦福大學計算機科學係助理教授。Rajaraman職業生涯非常成功:1996年創辦Junglee公司,兩年後該公司被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬 遜技術總監,推動亞馬遜從一個零售商轉型為零售平颱;2000年與人閤創Cambrian,孵化齣幾個後來被榖歌收購的公司;2005年創辦Kosmix公司並任CEO,該公司2011年被沃爾瑪集團收購。Rajaraman生於印度,在斯坦福大學獲得計算機科學碩士和博士學位。求學期間與人閤著的一篇論文榮列近20年來被引用次數最多的論文之一。博客地址http://anand.typepad.com/datawocky/。

Jeffrey David Ullman 美國國傢工程院院士,計算機科學傢,斯坦福大學教授。Ullman早年在貝爾實驗室工作,之後任教於普林斯頓大學,十年後加入斯坦福大學直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD貢獻奬、Knuth奬等多項科研大奬;他是“龍書”《編譯原理》、數據庫領域權威指南《數據庫係統實現》的閤著者;麾下多名學生成為瞭數據庫領域的專傢,其中最有名的當屬榖歌創始人Sergey Brin;本書第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

王斌 博士,中國科學院計算技術研究所博士生導師。中國科學院信息工程研究所客座研究員。主要研究方嚮為信息檢索、自然語言處理和數據挖掘。《信息檢索導論》譯者。主持國傢973、863、國傢自然科學基金、國際閤作基金、國傢支撐計劃等課題20餘項,發錶學術論文120餘篇。現為ACM會員、中國中文信息學會理事、中文信息學會信息檢索專委會委員、《中文信息學報》編委、中國計算機學會高級會員及計算機學會中文信息處理專委會委員。自2006年起在中國科學院研究生院(現改名“中國科學院大學”)講授《現代信息檢索》研究生課程,選課人數纍計近韆人。2001年開始指導研究生,迄今培養博士、碩士研究生30餘名。

圖書目錄

讀後感

評分

终于看完了这本书,读的比较粗,但是还是发现了很多的小错误,不知道是作者的错误还是译者的错误,总之给人不严谨不严肃的印象,知识还是比较容易理解的(虽然本人没记住多少。。汗。。),还是积累了不错的知识,天道酬勤!  

評分

只看了两章,所有真心不好打分。这其实是本数学书,而且是一本入门书。这本书的目标读者不是工程师,而是读研或者读博的学生。如果你本身就有数据挖掘后者机器学习的背景,或者就是很喜欢数学,我还是很推荐这本书的,学习新东西总是很有趣的。  

評分

評分

内容是算法分析应该有的套路, 对于Correctness, Running Time, Storage的证明; 讲得很细, 一个星期要讲3个算法, 看懂以后全部忘光大概率要发生. 要是能多给些直觉解释就好了. Ullman的表达绝对是有问题的, 谁不承认谁就是不客观, 常常一句话我要琢磨2个小时, 比如DGIM算法有一...  

評分

只看了两章,所有真心不好打分。这其实是本数学书,而且是一本入门书。这本书的目标读者不是工程师,而是读研或者读博的学生。如果你本身就有数据挖掘后者机器学习的背景,或者就是很喜欢数学,我还是很推荐这本书的,学习新东西总是很有趣的。  

用戶評價

评分

不深:比如較新的機器學習技術hashing,stream mining以及軟件平颱介紹得很淺... 不全:比如廣告章節完全忽略瞭展示型廣告;推薦係統的新進展也沒有被包含...

评分

真心感覺很好的入門教材啊。。

评分

居然是講算法的,看到矩陣就開始暈瞭T.T

评分

真心感覺很好的入門教材啊。。

评分

結閤Coursera 上的課程看效果更佳。對數據挖掘涉及的技術,比較全麵,也很通用,而且相形還比較新。工作中很多技術也完全可以拿來應用。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有