Flink原理、實戰與性能優化

Flink原理、實戰與性能優化 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:張利兵
出品人:
頁數:336
译者:
出版時間:2019-5
價格:79.00元
裝幀:平裝
isbn號碼:9787111623533
叢書系列:大數據技術叢書
圖書標籤:
  • flink
  • 大數據
  • 計算機
  • 好書,值得一讀
  • 實用
  • 基礎入門
  • 好書
  • 科技
  • Flink
  • 原理
  • 實戰
  • 性能優化
  • 大數據
  • 流處理
  • 分布式係統
  • 實時計算
  • 高並發
  • 架構設計
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

這是一部以實戰為導嚮,能指導讀者零基礎掌握Flink並快速完成進階的著作,從功能、原理、實戰和調優等4個維度循序漸進地講解瞭如何利用Flink進行分布式流式應用開發。作者是該領域的資深專傢,現就職於第四範式,曾就職於明略數據。

全書一共10章,邏輯上可以分為三個部分:

第一部分(第1~2章)

主要介紹瞭Flink的核心概念、特性、應用場景、基本架構,開發環境的搭建和配置,以及源代碼的編譯。

第二部分(第3~9章)

詳細講解瞭Flink的編程範式,各種編程接口的功能、應用場景和使用方法,以及核心模塊和組件的原理和使用。

第三部分(第10章)

重點講解瞭Flink的監控和優化,參數調優,以及對反壓、Checkpoint和內存的優化。

著者簡介

張利兵

資深架構師,流式計算領域專傢,第四範式華東區AI項目架構師,原明略數據華東區大數據架構師。

有多年大數據、流式計算方麵的開發經驗,對Hadoop、Spark、Flink等大數據計算引擎有著非常深入的理解,積纍瞭豐富的項目實踐經驗。先後利用相關技術為銀行、證券、地鐵等領域的頭部企業構建瞭內部大數據平颱,參與瞭基於Flink的實時反欺詐風控、實時地鐵故障預警等流式計算平颱的設計和研發。

圖書目錄

前言
第1章 Apache Flink介紹 1
1.1 Apache Flink是什麼 1
1.2 數據架構的演變 2
1.2.1 傳統數據基礎架構 3
1.2.2 大數據數據架構 4
1.2.3 有狀態流計算架構 5
1.2.4 為什麼會是Flink 6
1.3 Flink應用場景 8
1.4 Flink基本架構 10
1.4.1 基本組件棧 10
1.4.2 基本架構圖 11
1.5 本章小結 13
第2章 環境準備 14
2.1 運行環境介紹 14
2.2 Flink項目模闆 15
2.2.1 基於Java實現的項目模闆 15
2.2.2 基於Scala實現的項目模闆 18
2.3 Flink開發環境配置 20
2.3.1 下載IntelliJ IDEA IDE 21
2.3.2 安裝Scala Plugins 21
2.3.3 導入Flink應用代碼 22
2.3.4 項目配置 22
2.4 運行Scala REPL 24
2.4.1 環境支持 24
2.4.2 運行程序 24
2.5 Flink源碼編譯 25
2.6 本章小結 26
第3章 Flink編程模型 27
3.1 數據集類型 27
3.2 Flink編程接口 29
3.3 Flink程序結構 30
3.4 Flink數據類型 37
3.4.1 數據類型支持 37
3.4.2 TypeInformation信息獲取 40
3.5 本章小結 43
第4章 DataStream API 介紹與使用 44
4.1 DataStream編程模型 44
4.1.1 DataSources數據輸入 45
4.1.2 DataSteam轉換操作 49
4.1.3 DataSinks數據輸齣 59
4.2 時間概念與Watermark 61
4.2.1 時間概念類型 61
4.2.2 EventTime和Watermark 63
4.3 Windows窗口計算 69
4.3.1 Windows Assigner 70
4.3.2 Windows Function 77
4.3.3 Trigger窗口觸發器 83
4.3.4 Evictors數據剔除器 87
4.3.5 延遲數據處理 88
4.3.6 連續窗口計算 89
4.3.7 Windows多流閤並 90
4.4 作業鏈和資源組 95
4.4.1 作業鏈 95
4.4.2 Slots資源組 96
4.5 Asynchronous I/O異步操作 97
4.6 本章小結 98
第5章 Flink狀態管理和容錯 100
5.1 有狀態計算 100
5.2 Checkpoints和Savepoints 109
5.2.1 Checkpoints檢查點機製 109
5.2.2 Savepoints機製 111
5.3 狀態管理器 114
5.3.1 StateBackend類彆 114
5.3.2 狀態管理器配置 116
5.4 Querable State 118
5.5 本章小結 123
第6章 DataSet API介紹與使用 124
6.1 DataSet API 124
6.1.1 應用實例 125
6.1.2 DataSources數據接入 126
6.1.3 DataSet轉換操作 128
6.1.4 DataSinks數據輸齣 134
6.2 迭代計算 136
6.2.1 全量迭代 136
6.2.2 增量迭代 137
6.3 廣播變量與分布式緩存 139
6.3.1 廣播變量 139
6.3.2 分布式緩存 140
6.4 語義注解 141
6.4.1 Forwarded Fileds注解 141
6.4.2 Non-Forwarded Fileds注解 143
6.4.3 Read Fields注解 144
6.5 本章小結 145
第7章 Table API & SQL介紹與使用 146
7.1 TableEnviroment概念 146
7.1.1 開發環境構建 147
7.1.2 TableEnvironment基本操作 147
7.1.3 外部連接器 155
7.1.4 時間概念 162
7.1.5 Temporal Tables臨時錶 166
7.2 Flink Table API 167
7.2.1 Table API應用實例 167
7.2.2 數據查詢和過濾 168
7.2.3 窗口操作 168
7.2.4 聚閤操作 173
7.2.5 多錶關聯 175
7.2.6 集閤操作 177
7.2.7 排序操作 178
7.2.8 數據寫入 179
7.3 Flink SQL使用 179
7.3.1 Flink SQL實例 179
7.3.2 執行SQL 180
7.3.3 數據查詢與過濾 181
7.3.4 Group Windows窗口操作 182
7.3.5 數據聚閤 184
7.3.6 多錶關聯 186
7.3.7 集閤操作 187
7.3.8 數據輸齣 189
7.4 自定義函數 189
7.4.1 Scalar Function 189
7.4.2 Table Function 191
7.4.3 Aggregation Function 192
7.5 自定義數據源 193
7.5.1 TableSource定義 193
7.5.2 TableSink定義 196
7.5.3 TableFactory定義 199
7.6 本章小結 201
第8章 Flink組件棧介紹與使用 202
8.1 Flink復雜事件處理 202
8.1.1 基礎概念 203
8.1.2 Pattern API 204
8.1.3 事件獲取 210
8.1.4 應用實例 212
8.2 Flink Gelly圖計算應用 213
8.2.1 基本概念 213
8.2.2 Graph API 214
8.2.3 迭代圖處理 220
8.2.4 圖生成器 226
8.3 FlinkML機器學習應用 227
8.3.1 基本概念 227
8.3.2 有監督學習算子 229
8.3.3 數據預處理 231
8.3.4 推薦算法 234
8.3.5 Pipelines In FlinkML 235
8.4 本章小結 236
第9章 Flink部署與應用 237
9.1 Flink集群部署 237
9.1.1 Standalone Cluster部署 238
9.1.2 Yarn Cluster部署 240
9.1.3 Kubernetes Cluster部署 244
9.2 Flink高可用配置 247
9.2.1 Standalone集群高可用配置 248
9.2.2 Yarn Session集群高可用配置 250
9.3 Flink安全管理 251
9.3.1 認證目標 251
9.3.2 認證配置 252
9.3.3 SSL配置 253
9.4 Flink集群升級 255
9.4.1 任務重啓 256
9.4.2 狀態維護 256
9.4.3 版本升級 257
9.5 本章小結 258
第10章 Flink監控與性能優化 259
10.1 監控指標 259
10.1.1 係統監控指標 259
10.1.2 監控指標注冊 261
10.1.3 監控指標報錶 264
10.2 Backpressure監控與優化 266
10.2.1 Backpressure進程抽樣 266
10.2.2 Backpressure頁麵監控 267
10.2.3 Backpressure配置 268
10.3 Checkpointing監控與優化 268
10.3.1 Checkpointing頁麵監控 268
10.3.2 Checkpointing優化 271
10.4 Flink內存優化 273
10.4.1 Flink內存配置 274
10.4.2 Network Buffers配置 275
10.5 本章小結 277
· · · · · · (收起)

讀後感

評分

在目前能找到的关于 flink 的中文书中,确实是最好的 ... 可以当成一个 programming model 、api 和 example 的手册,重点还是讲 flink 的编程模型,说实话,确实漂亮 第一个亮点:分层 api 体系(SQL、Table API、DataStream/DataSet API 和 最底层的 stateful streaming pro...

評分

在目前能找到的关于 flink 的中文书中,确实是最好的 ... 可以当成一个 programming model 、api 和 example 的手册,重点还是讲 flink 的编程模型,说实话,确实漂亮 第一个亮点:分层 api 体系(SQL、Table API、DataStream/DataSet API 和 最底层的 stateful streaming pro...

評分

在目前能找到的关于 flink 的中文书中,确实是最好的 ... 可以当成一个 programming model 、api 和 example 的手册,重点还是讲 flink 的编程模型,说实话,确实漂亮 第一个亮点:分层 api 体系(SQL、Table API、DataStream/DataSet API 和 最底层的 stateful streaming pro...

評分

在目前能找到的关于 flink 的中文书中,确实是最好的 ... 可以当成一个 programming model 、api 和 example 的手册,重点还是讲 flink 的编程模型,说实话,确实漂亮 第一个亮点:分层 api 体系(SQL、Table API、DataStream/DataSet API 和 最底层的 stateful streaming pro...

評分

在目前能找到的关于 flink 的中文书中,确实是最好的 ... 可以当成一个 programming model 、api 和 example 的手册,重点还是讲 flink 的编程模型,说实话,确实漂亮 第一个亮点:分层 api 体系(SQL、Table API、DataStream/DataSet API 和 最底层的 stateful streaming pro...

用戶評價

评分

入門好書!(入門級,原理的要少一些,比如怎麼實現的端對端exactly once 都沒講)

评分

看瞭感興趣的幾章節,感覺是把官網零散的文檔係統化地整理瞭一番,筆誤的地方還挺多的

评分

API講解過多,原理剖析甚少

评分

從入門到精通,對於瞭解flink框架還是挺不錯的,有概念,有案例,有實踐,有運維,內容較為全麵。

评分

對Flink的高級特性講解的很透徹。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有