大數據架構商業之路

大數據架構商業之路 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:黃申
出品人:
頁數:298
译者:
出版時間:2016-5-1
價格:69.00元
裝幀:平裝
isbn號碼:9787111535287
叢書系列:大數據技術叢書
圖書標籤:
  • 大數據
  • 架構
  • 數據分析
  • 係統架構
  • 商業
  • 業務需求
  • 商業智能
  • 人工智能
  • 大數據
  • 架構
  • 商業
  • 應用
  • 技術
  • 發展
  • 企業
  • 決策
  • 分析
  • 實踐
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

目前大數據技術已經日趨成熟,但是業界發現與大數據相關的産品設計和研發仍然非常睏難,技術、産品和商業的結閤度還遠遠不夠。這主要是因為大數據涉及範圍廣、技術含量高、更新換代快,門檻也比其他大多數IT行業更高。人們要麼使用昂貴的商業解決方案,要麼花費巨大的精力摸索。本書通過一個虛擬的互聯網O2O創業故事,來逐步展開介紹創業各個階段可能遇到的大數據課題、業務需求,以及相對應的技術方案,甚至是實踐解析;讓讀者身臨其境,一起來探尋大數據的奧秘。書中會覆蓋較廣泛的技術點,並提供相應的背景知識介紹,對於想進一步深入研究細節的讀者,也可輕鬆獲得繼續閱讀的方嚮和指導性建議。

著者簡介

黃申,博士,畢業於上海交通大學計算機科學與工程專業,師從俞勇教授。微軟學者,IBMExtremeBlue天纔計劃成員。長期專注於大數據相關的搜索、推薦、廣告以及用戶精準化領域。曾在微軟亞洲研究院、eBay中國、沃爾瑪1號店和大潤發飛牛網擔任要職,帶隊完成瞭若乾公司級的戰略項目。同時著有20多篇國際論文和10多項國際專利,兼任《計算機工程》期刊特邀審稿專傢。因其對業界的卓越貢獻,2015年獲得美國政府頒發的“美國傑齣人纔”稱號。

圖書目錄

推薦序一
推薦序二
前  言
第1章 抉擇 1
第2章 數據收集 4
2.1 互聯網數據收集 4
2.1.1 網絡爬蟲 5
2.1.2 Apache Nutch簡介 11
2.1.3 Heritrix簡介 14
2.2 內部數據收集 15
2.2.1 Apache Flume簡介 17
2.2.2 Facebook Scribe和Logstash 21
2.3 本章心得 21
2.4 參考資料 22
第3章 數據存儲 23
3.1 持久化存儲 23
3.1.1 Hadoop和HDFS 25
3.1.2 HBase簡介 28
3.1.3 MongoDB 35
3.2 非持久化存儲 37
3.2.1 緩存和散列 37
3.2.2 Memcached和Berkeley DB簡介 41
3.2.3 Redis簡介 41
3.3 本章心得 44
3.4 參考資料 44
第4章 數據處理 46
4.1 離綫批量處理 46
4.1.1 Hadoop的MapReduce 47
4.1.2 Spark簡介 52
4.1.3 Hive簡介 53
4.1.4 Pig、Impala和Spark SQL 56
4.2 提升及時性:消息機製 58
4.2.1 ActiveMQ簡介 60
4.2.2 Kafka簡介 61
4.3 在綫實時處理 63
4.3.1 Storm簡介 63
4.3.2 Spark Streaming簡介 66
4.4 本章心得 66
4.5 參考資料 67
第5章 信息檢索 69
5.1 基本理念 70
5.2 相關性 70
5.2.1 布爾模型 70
5.2.2 基於排序的布爾模型 71
5.2.3 嚮量空間模型 74
5.2.4 語言模型 75
5.3 及時性 77
5.4 與數據庫查詢的對比 81
5.5 搜索引擎 82
5.5.1 Web搜索中的鏈接分析 83
5.5.2 電子商務中的商品排序 86
5.5.3 多因素和基於學習的排序 88
5.5.4 係統框架 89
5.5.5 Lucene簡介 93
5.5.6 Solr簡介 98
5.5.7 Elasticsearch簡介 104
5.6 推薦係統 108
5.6.1 推薦的核心要素 109
5.6.2 推薦係統的分類 110
5.6.3 混閤模型 115
5.6.4 係統架構 116
5.6.5 Mahout 116
5.7 在綫廣告 119
5.8 本章心得 127
5.9 參考資料 128
第6章 數據挖掘 130
6.1 基本理念 131
6.2 數據的錶示和預處理 133
6.3 機器學習算法 136
6.4 挖掘工具 157
6.5 本章心得 165
6.6 參考資料 165
第7章 效能評估 167
7.1 效果評估 168
7.2 性能評估 190
7.3 本章心得 202
7.4 參考資料 202
第8章 大數據技術全景 204
第9章 商品太多啦!需要搜索引擎 207
9.1 業務需求 207
9.2 産品設計和技術選型 208
9.3 實現方案 211
第10章 能否更主動?還需要推薦引擎 223
10.1 業務需求 223
10.2 産品設計和技術選型 225
10.3 實現方案 230
第11章 這樣做的效果如何 241
11.1 業務需求 241
11.2 産品設計和技術選型 242
11.3 實現方案 243
第12章 這個搜索有點遜 258
12.1 業務需求:還要搜得更多 258
12.2 “還要搜得更多”:産品設計和技術選型 259
12.3 “還要搜得更多”的方案實現 261
12.4 業務需求:還要搜得更準 265
12.5 “還要搜得更準”:産品設計和技術選型 266
12.6 “還要搜得更準”的方案實現 271
12.7 業務需求:還要更快 273
12.8 還要“變”得更快:産品設計和技術選型 274
12.9 還要“搜”得更快:産品設計和技術選型 275
12.10 業務需求:給點提示吧 280
12.11 給點提示吧:産品設計和技術選型 282
第13章 支持更高效的運營 287
13.1 業務需求:互聯網時代的CRM 287
13.2 互聯網時代的CRM:産品設計和技術選型 288
13.3 業務需求:抓住搗蛋鬼 291
13.4 抓住搗蛋鬼:産品設計和技術選型 292
13.5 業務需求:銷售之戰 295
13.6 銷售之戰:産品設計和技術選型 296
後記 299
· · · · · · (收起)

讀後感

評分

这是我迄今为止看到的关于业务与技术融合的最好的大数据领域初中级适用的案头书籍,没有之一。作者从业务需求出发详述了数据采集、数据整理、数据存储、数据分析,应用场景的概念、方法、技术以及开源的产品分析,功能、优缺点,涉及到应用场景的部分详细给出了模型、常用算法...

評分

刚拿到书时,看到书名感觉像是一本讲商业与产品的书,一开始我关键的关键词是“大数据”、“商业”、“业务需求”,但实际阅读完书籍,可能就会与最初的印象有所不一样,在我的理解中,作者的主线更接近于**“大数据——技术方案——架构——业务需求——商业”** ,这本书实际...  

評分

这是我迄今为止看到的关于业务与技术融合的最好的大数据领域初中级适用的案头书籍,没有之一。作者从业务需求出发详述了数据采集、数据整理、数据存储、数据分析,应用场景的概念、方法、技术以及开源的产品分析,功能、优缺点,涉及到应用场景的部分详细给出了模型、常用算法...

評分

这是我迄今为止看到的关于业务与技术融合的最好的大数据领域初中级适用的案头书籍,没有之一。作者从业务需求出发详述了数据采集、数据整理、数据存储、数据分析,应用场景的概念、方法、技术以及开源的产品分析,功能、优缺点,涉及到应用场景的部分详细给出了模型、常用算法...

評分

刚拿到书时,看到书名感觉像是一本讲商业与产品的书,一开始我关键的关键词是“大数据”、“商业”、“业务需求”,但实际阅读完书籍,可能就会与最初的印象有所不一样,在我的理解中,作者的主线更接近于**“大数据——技术方案——架构——业务需求——商业”** ,这本书实际...  

用戶評價

评分

本書的第一大部分概述瞭大數據的主要技術,包括大數據的獲取、存儲、處理,還有架構設計的基本理念,以及常用的消息和緩存機製。這一部分你會發現關於Nutch、Flume、Hadoop、HBase、Redis、Hive、Kafka、Spark、Storm等的簡介。對於數據處理的高級技術,本書著墨不少,但不乏對於信息檢索和數據挖掘課題的探討。例如站內搜索引擎、推薦係統、廣告係統、聚類、分類和綫性迴歸等。由於商業需求尤其看重實際産齣,因此第一部分的最後還會分析常見的效果和性能評估。 第二大部分的每個章節都是從業務需求的描述入手,然後進行需求分析,根據需求的特點,對第一大部分所涉及的備選技術進行篩選,最後是技術方案和架構的確定。不同的商業需求可能會使用類似的技術點。

评分

本書的第一大部分概述瞭大數據的主要技術,包括大數據的獲取、存儲、處理,還有架構設計的基本理念,以及常用的消息和緩存機製。這一部分你會發現關於Nutch、Flume、Hadoop、HBase、Redis、Hive、Kafka、Spark、Storm等的簡介。對於數據處理的高級技術,本書著墨不少,但不乏對於信息檢索和數據挖掘課題的探討。例如站內搜索引擎、推薦係統、廣告係統、聚類、分類和綫性迴歸等。由於商業需求尤其看重實際産齣,因此第一部分的最後還會分析常見的效果和性能評估。 第二大部分的每個章節都是從業務需求的描述入手,然後進行需求分析,根據需求的特點,對第一大部分所涉及的備選技術進行篩選,最後是技術方案和架構的確定。不同的商業需求可能會使用類似的技術點。

评分

文字太差瞭。不過好在內容比較實在。

评分

寫的還行,作者能結閤技術和需求,可以參考和入門。

评分

有趣有趣,實在有趣! 容量太大瞭,三天看完,腦袋有點大。後麵用到瞭再迴顧吧。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有