企業大數據係統構建實戰:技術、架構、實施與應用

企業大數據係統構建實戰:技術、架構、實施與應用 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:呂兆星 鄭傳峰 宋天龍 楊曉鵬 著
出品人:
頁數:0
译者:
出版時間:2017-5-26
價格:89.00
裝幀:平裝
isbn號碼:9787111568766
叢書系列:
圖書標籤:
  • 大數據
  • 企業
  • 實用落地
  • 係統
  • 佳作
  • 計算機
  • 數據分析
  • 作者陣容強大
  • 企業大數據
  • 係統構建
  • 技術實現
  • 架構設計
  • 實施流程
  • 數據應用
  • 雲計算
  • 分布式係統
  • 數據治理
  • 實戰案例
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

對於很多企業而言,大數據的重要性不言而喻,但是如何構建、實施和應用大數據係統卻是一個復雜工程。本書讓讀者認識到大數據不僅僅是數據、技術、架構、應用,更是結閤瞭商業模式、戰略定位、信息安全、單位協同、組織保障、實施選型的完整體係。

本書內容從大數據的規劃定位、組織實施和價值提升三個維度展開,兼顧從整體性、全局性、安全性、價值性、技術性、體係性等方麵的考慮。

第一部分:企業大數據戰略規劃

主要從宏觀的角度介紹大數據的定位、組織保障、解決方案選擇和自主實施思路,目的是從全局角度引導建立大數據工作的整體思維。

第二部分:企業大數據落地實施

主要從執行層麵介紹瞭大數據落地相關的技術、架構、開發、大數據工作流、應用和價值評估,直接以落地視角解讀大數據工作中每個環節涉及到的流程、知識和方法,這也是本書的核心章節。

第三部分:大數據價值、變革和挑戰

主要涉及大數據的社會價值、當前問題和挑戰以及大數據的未來趨勢,這是對現有大數據工作的延展以及未來趨勢的探索。

著者簡介

呂兆星(EthanLv)

資深大數據技術專傢,精通基於大數據的分布式數據挖掘、存儲與計算技術,及其生態體係架構;精通垂直搜索技術、機器學習、文本情感傾嚮性挖掘、網絡爬蟲、全文索引體係架構。曾任軟通動力集團大數據研究院總架構師、HiveCloud創始人,蘿蔔網CTO,國美在綫大數據中心高級架構師等。

主導研發的大數據和文本挖掘平颱包括:DMP、DSP、推薦係統、決策運營係統、iCreations係列産品、蜂棱係列産品、軍犬輿情係列産品等。成功應用到能源、電力、電商、電信、金融、政府、食品、醫療保健等行業,超過500個政府和企業用戶。《基於機器學習的數據挖掘模型》獲得國傢級技術創新基金,蘿蔔課堂特邀高級講師。

鄭傳峰(PeterZheng)

大數據業務應用領域專傢,主導大數據方嚮戰略規劃,包含數據産品、數據應用、數據價值變現等方嚮。曾任軟通動力數據科技公司資深數據應用專傢,HiveCloud首席戰略官。

階段性負責國美電器、國美在綫、庫巴網會員營銷、網站運營和産品設計工作,在CRM係統、DMP數據平颱、精準營銷係統、廣告精投、能源大數據擁有多年的操盤經驗,包含大數據上層應用服務産品設計、谘詢和實施。參與多個大型企業大數據戰略規劃和實施,行業覆蓋零售、電商、電信、政府、交通、能源和電力等。

宋天龍(TonySong)

大數據領域的資深數據分析、挖掘和建模專傢,精通端到端數據價值場景設計、業務需求轉換、數據結構梳理、數據建模與學習,以及數據工程交付。曾任軟通動力集團大數據研究院數據總監,Webtrekk(德國最大的網站數據分析服務提供商)中國區技術和谘詢負責人,國美大數據中心經理。

擁有豐富的大數據項目工作經驗,參與過集團和企業級大數據存儲平颱、大數據開發和集成平颱、數據體係規劃、大數據産品開發、網站流量係統建設、網站智能推薦、企業大數據智能等大型數據工作項目。參與實施客戶案例包括Webpower、德國OTTO集團電子商務(中國),Esprit中國、豬八戒網、順豐優選、樂視商城、泰康人壽、酒仙網,國美在綫、迪信通等。閤作培訓及沙龍單位包括人民大學、數盟、蘿蔔網、Netconcepts、觸脈、中商聯數據分析委等。蘿蔔課堂、天善學院特邀講師,百度文庫認證作傢,36大數據、站長之傢、互聯網分析沙龍專欄作傢。著有《網站數據挖掘與分析:係統方法與商業實踐》一書。

楊曉鵬(KelvinYang)

大數據及BI技術領域資深架構師,精通傳統數據模式及大數據分布模式的數據存儲、計算與應用架構,以及大數據量的數據遷移、存儲、索引、計算、分析與挖掘等相關環節的設計、實現與優化。曾任軟通動力集團大數據研究院高級架構師,HiveCloud總架構師,主導大數據存儲平颱、計算平颱和應用服務平颱的設計與研發。曾任居然之傢O2O大數據平颱總負責人、中國銀聯大數據報文分析項目高級技術顧問、國美在綫大數據中心高級技術工程師。

曾參與企業級項目包括大型電商網站的BI係統、數據倉庫、大數據係統等設計和研發項目,金融銀行類企業風險及異常交易分析項目。實施大中型企業數據項目包括居然之傢、中國銀聯、華農保險、中國電信等超過50傢客戶案例。精通大數據Hadoop,Hive,HBase,Impala,Spark等組件架構與實施,精通數學模型,自主開發實現分治/覆蓋的C4.5決策樹、馬爾科夫預測、KMeans、Apriori等模型算法程序,成功應用到電商、金融等行業。

圖書目錄

Contents 目  錄
前言
第1章 企業大數據戰略定位 1
1.1 宏觀 1
1.2 微觀 4
1.2.1 資源協同 5
1.2.2 戰略定位 6
1.2.3 啓動契機 7
1.2.4 大數據曆程 9
1.3 本章小結 12
第2章 企業大數據職能規劃 13
2.1 大數據組織架構體係 13
2.1.1 大數據部門在企業中的角色 13
2.1.2 常見的大數據職能及職責 17
2.2 大數據職位構建體係 24
2.2.1 基礎平颱類 24
2.2.2 數據管理類 26
2.2.3 技術研發類 27
2.2.4 産品設計類 30
2.2.5 數據挖掘類 32
2.2.6 數據分析類 33
2.3 大數據製度和流程規範 35
2.3.1 製度和流程規範意義 35
2.3.2 製度和流程規範內容 35
2.3.3 製度和流程規範模闆 42
2.4 本章小結 44
第3章 企業大數據解決方案 45
3.1 企業大數據解決方案實現方式 45
3.1.1 獨立研發 45
3.1.2 第三方解決方案 46
3.1.3 聯閤開發 57
3.2 如何選擇解決方案 58
3.2.1 外部環境分析 58
3.2.2 內部環境分析 59
3.2.3 需求規劃分析 62
3.2.4 解決方案特性分析 63
3.2.5 解決方案費用評估 67
3.3 本章小結 70
第4章 企業大數據自主實施思路 71
4.1 製定規劃原則 71
4.1.1 價值性 71
4.1.2 實時性 72
4.1.3 高效性 72
4.1.4 安全性 72
4.1.5 延展性 73
4.1.6 全局性 74
4.2 製定目標藍圖 75
4.3 製定建設目標 76
4.4 明確組織規劃 78
4.4.1 組織結構設計的作用 79
4.4.2 組織結構設立的導嚮 79
4.4.3 組織結構的最終設立 81
4.5 設計技術方案 85
4.5.1 大數據係統建設方案 85
4.5.2 大數據係統與傳統BI的融閤方案 91
4.6 製定人纔規劃 94
4.6.1 指導思想 94
4.6.2 規劃原則 94
4.6.3 核心內容 95
4.7 投入産齣評估 97
4.7.1 數據投入與産齣的內涵 97
4.7.2 數據投入與産齣的特徵 98
4.7.3 數據投入與産齣的管理 99
4.8 數據風險管理 105
4.8.1 數據風險管理的概念 105
4.8.2 數據風險管理的類型 106
4.8.3 數據風險管理的原則 109
4.8.4 數據風險管理與控製 110
4.9 本章小結 114
第5章 大數據技術介紹 115
5.1 核心技術 115
5.1.1 Hadoop生態 115
5.1.2 NoSQL 142
5.1.3 實時計算 150
5.1.4 全文檢索 160
5.2 相關技術 204
5.2.1 數據可視化 204
5.2.2 數據緩存 220
5.2.3 中間件 227
5.2.4 關係型數據庫 236
5.2.5 數據ETL 245
5.3 大數據算法庫 250
5.4 本章小結 276
第6章 大數據架構設計 277
6.1 大數據架構設計原則 277
6.2 大數據核心架構要素 279
6.3 大數據架構設計模式 284
6.4 本章小結 289
第7章 大數據技術開發 290
7.1 數據采集 290
7.1.1 批量采集 291
7.1.2 增量采集 292
7.2 數據存儲 293
7.2.1 HDFS文件存儲引擎 294
7.2.2 Hive數據存儲引擎 295
7.2.3 HBase列式存儲引擎 295
7.2.4 MySQL關係型數據存儲引擎 296
7.3 多維計算 296
7.4 功能服務 299
7.5 平颱管理 301
7.5.1 監控管理 301
7.5.2 調度管理 302
7.5.3 權限管理 304
7.6 應用域 307
7.7 本章小結 308
第8章 大數據工作流 309
8.1 數據源 310
8.1.1 日誌/文件 310
8.1.2 數據庫 310
8.1.3 網絡爬蟲 311
8.1.4 第三方API/閤作 311
8.2 數據處理 312
8.2.1 數據質量校驗 312
8.2.2 清洗轉換 316
8.2.3 質量提升 320
8.2.4 數據脫敏 321
8.2.5 集成整閤 323
8.3 數據存儲 324
8.3.1 關係型數據庫 324
8.3.2 分布式文件係統 325
8.4 數據計算 325
8.4.1 三種數據計算時效性 325
8.4.2 結構化數據計算 327
8.4.3 半/非結構化數據計算 333
8.4.4 深度挖掘學習 360
8.5 數據應用 376
8.5.1 輔助決策 376
8.5.2 數據驅動 377
8.6 數據質量管理 379
8.6.1 數據質量建設的內涵 379
8.6.2 影響數據質量的常見因素 380
8.6.3 數據質量建設的框架 381
8.7 本章小結 392
第9章 企業大數據業務應用 393
9.1 大數據應用場景概述 393
9.1.1 場景商業目的分析 394
9.1.2 場景數據來源分析 394
9.1.3 場景數據難易分析 397
9.1.4 場景應用舉例 397
9.2 用戶畫像 407
9.2.1 業務應用背景 407
9.2.2 主要實現過程 408
9.2.3 關鍵應用場景 414
9.2.4 應用價值提煉 415
9.2.5 場景總結迴顧 417
9.3 個性化營銷 419
9.3.1 業務應用背景 419
9.3.2 主要實現過程 421
9.3.3 關鍵應用場景 424
9.3.4 應用價值提煉 425
9.3.5 場景總結迴顧 426
9.4 精準廣告 427
9.4.1 業務應用背景 427
9.4.2 主要實現過程 429
9.4.3 關鍵應用場景 438
9.4.4 應用價值提煉 439
9.4.5 場景總結迴顧 440
9.5 徵信 441
9.5.1 應用場景背景 441
9.5.2 主要實現過程 442
9.5.3 主要應用場景 447
9.5.4 應用價值提煉 449
9.5.5 場景總結迴顧 449
9.6 本章小結 450
第10章 企業大數據價值評估 451
10.1 資産價值 451
10.1.1 數據規模 451
10.1.2 數據價值度 452
10.1.3 數據鮮活性 454
10.1.4 數據關聯維度 454
10.1.5 數據粒度 455
10.2 業務價值 455
10.2.1 用戶體驗提升 455
10.2.2 運營優化 457
10.2.3 銷售貢獻 460
10.2.4 供應鏈優化 461
10.3 本章小結 462
第11章 大數據的社會價值 463
11.1 民生價值 463
11.2 政務價值 465
11.3 産業價值 468
11.4 本章小結 470
第12章 大數據當前問題及挑戰 471
12.1 數據挑戰 471
12.2 安全挑戰 472
12.3 價值挑戰 474
12.4 認知挑戰 475
12.5 技術挑戰 478
12.6 人纔挑戰 480
12.7 本章小結 481
第13章 大數據未來趨勢 482
13.1 價值資産化 482
13.2 産業生態化 487
13.3 主體社會化 490
13.4 應用智能化 491
13.5 本章小結 492
· · · · · · (收起)

讀後感

評分

如果你是学习软件开发的学生,如果你初入计算机行业,如果你是互联网大数据从业人员,你一定要看这一本书。作者以多年经验,作为一名资深专业人士,从企业管理者的角度,对行业内部进行总结,细节方面,不仅涉及具体技术,更从整体层面给你讲述架构。 文章涉及行业内具体事例,...

評分

如果你是学习软件开发的学生,如果你初入计算机行业,如果你是互联网大数据从业人员,你一定要看这一本书。作者以多年经验,作为一名资深专业人士,从企业管理者的角度,对行业内部进行总结,细节方面,不仅涉及具体技术,更从整体层面给你讲述架构。 文章涉及行业内具体事例,...

評分

如果你是学习软件开发的学生,如果你初入计算机行业,如果你是互联网大数据从业人员,你一定要看这一本书。作者以多年经验,作为一名资深专业人士,从企业管理者的角度,对行业内部进行总结,细节方面,不仅涉及具体技术,更从整体层面给你讲述架构。 文章涉及行业内具体事例,...

評分

如果你是学习软件开发的学生,如果你初入计算机行业,如果你是互联网大数据从业人员,你一定要看这一本书。作者以多年经验,作为一名资深专业人士,从企业管理者的角度,对行业内部进行总结,细节方面,不仅涉及具体技术,更从整体层面给你讲述架构。 文章涉及行业内具体事例,...

評分

如果你是学习软件开发的学生,如果你初入计算机行业,如果你是互联网大数据从业人员,你一定要看这一本书。作者以多年经验,作为一名资深专业人士,从企业管理者的角度,对行业内部进行总结,细节方面,不仅涉及具体技术,更从整体层面给你讲述架构。 文章涉及行业内具体事例,...

用戶評價

评分

整體還算推薦:1-4章試讀後覺得不錯就買瞭;5-8章乾貨滿滿,讀大數據架構及相關技術介紹很全麵,不過具體的技術還是要單獨去全麵瞭解;9-13章沒什麼乾貨,大緻翻一遍。

评分

這是一本真正能指導企業實現復雜的大數據係統落地的書,而不隻是關注某一項技術。幾位作者都是在大數據各個環節都有深厚積纍和豐富實踐經驗的,非常互補。

评分

就是一鍋大雜燴

评分

羅列齊全的工具書

评分

就是一鍋大雜燴

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有