深入理解Flink:实时大数据处理实践

深入理解Flink:实时大数据处理实践 pdf epub mobi txt 电子书 下载 2025

出版者:电子工业出版社
作者:余海峰
出品人:博文视点
页数:304
译者:
出版时间:2019-4
价格:89.00元
装帧:平装
isbn号码:9787121360459
丛书系列:大数据丛书
图书标签:
  • Flink
  • 计算机
  • 垃圾
  • 技术
  • 已购买
  • 大数据
  • Flink
  • 实时处理
  • 大数据
  • 流处理
  • 分布式系统
  • 并发控制
  • 数据流
  • 高并发
  • 容错机制
  • 性能优化
想要找书就要到 小美书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

《深入理解Flink:实时大数据处理实践》介绍了实时数据处理引擎Flink,讲解了流处理API、批处理API、机器学习引擎FlinkML、关系型API、复杂事件处理,以及指标度量与部署模式,分析了流式数据处理理论中时间、窗口、水印、触发器、迟到生存期之间的关联和关系,深入分析了多项式曲线拟合、分类算法、推荐算法的理论和FlinkML实现。

《深入理解Flink:实时大数据处理实践》适合希望快速上手Flink 以开展实时大数据处理与在线机器学习应用的从业者阅读。

作者简介

目录信息

第1 章 流式数据架构理论 ............................................................................... 1
1.1 大数据处理架构演进历程 ......................................................................... 1
1.2 案例分析 ..................................................................................................... 8
1.2.1 SK 电信驾驶安全性评分 ................................................................ 8
1.2.2 流式机器学习应用 ........................................................................ 12
1.3 流式数据架构基本概念 ........................................................................... 17
1.3.1 流 .................................................................................................... 17
1.3.2 时间 ................................................................................................ 18
1.3.3 窗口 ................................................................................................ 21
1.3.4 水印 ................................................................................................ 23
1.3.5 触发器 ............................................................................................ 23
1.3.6 数据处理模式 ................................................................................ 23
1.3.7 如何理解流式数据架构的内在机制 ............................................ 27
1.4 根据事件时间开滚动窗口 ....................................................................... 28
1.4.1 what:转换/where:窗口 ........................................................... 29
1.4.2 when:水印 ................................................................................... 29
1.4.3 when:触发器 ............................................................................... 32
1.4.4 when:迟到生存期 ....................................................................... 34
1.4.5 how:累加模式 ............................................................................. 35
1.5 一致性 ....................................................................................................... 37
1.5.1 有状态计算 .................................................................................... 37
1.5.2 exactly-once 语义 ........................................................................... 38
1.5.3 异步屏障快照 ................................................................................ 39
1.5.4 保存点 ............................................................................................ 44
1.6 思考题 ....................................................................................................... 45
第2 章 编程基础 ........................................................................................... 46
2.1 Flink 概述 ................................................................................................. 46
2.2 让轮子转起来 ........................................................................................... 47
2.2.1 本书约定 ........................................................................................ 47
2.2.2 搭建单机版环境 ............................................................................ 48
2.2.3 配置IDEA ..................................................................................... 51
2.3 编程模型 ................................................................................................... 53
2.3.1 分层组件栈 .................................................................................... 53
2.3.2 流式计算模型 ................................................................................ 54
2.3.3 流处理编程 .................................................................................... 57
2.4 运行时 ....................................................................................................... 62
2.4.1 运行时结构 .................................................................................... 62
2.4.2 任务调度 ........................................................................................ 66
2.4.3 物理执行计划 ................................................................................ 69
2.5 思考题 ....................................................................................................... 70
第3 章 流处理API ........................................................................................ 71
3.1 流处理API 概述....................................................................................... 71
3.2 时间处理 ................................................................................................... 73
3.2.1 时间 ................................................................................................ 73
3.2.2 水印 ................................................................................................ 74
3.2.3 周期性水印生成器 ........................................................................ 75
3.2.4 间歇性水印生成器 ........................................................................ 77
3.2.5 递增式水印生成器 ........................................................................ 78
3.3 算子 ........................................................................................................... 79
3.3.1 算子函数 ........................................................................................ 80
3.3.2 数据分区 ........................................................................................ 83
3.3.3 资源共享 ........................................................................................ 85
3.3.4 RichFunction .................................................................................. 85
3.3.5 输出带外数据 ................................................................................ 86
3.4 窗口 ........................................................................................................... 86
3.4.1 窗口分类 ........................................................................................ 87
3.4.2 窗口函数 ........................................................................................ 90
3.4.3 触发器 ............................................................................................ 94
3.4.4 清除器 ............................................................................................ 96
3.4.5 迟到生存期 .................................................................................... 96
3.5 连接器 ....................................................................................................... 97
3.5.1 HDFS 连接器 ................................................................................. 98
3.5.2 Kafka .............................................................................................. 99
3.5.3 异步I/O ........................................................................................ 102
3.6 状态管理 ................................................................................................. 104
3.6.1 状态分类 ...................................................................................... 104
3.6.2 托管的Keyed State ...................................................................... 104
3.6.3 状态后端配置 .............................................................................. 106
3.7 检查点 ..................................................................................................... 107
3.8 思考题 ..................................................................................................... 108
第4 章 批处理API ...................................................................................... 109
4.1 批处理API 概述..................................................................................... 109
4.1.1 程序结构 ...................................................................................... 110
4.1.2 Source ........................................................................................... 111
4.1.3 Sink ............................................................................................... 112
4.1.4 连接器 .......................................................................................... 112
4.2 算子 ......................................................................................................... 113
4.2.1 算子函数 ...................................................................................... 113
4.2.2 广播变量 ...................................................................................... 121
4.2.3 文件缓存 ...................................................................................... 122
4.2.4 容错 .............................................................................................. 123
4.3 迭代 ......................................................................................................... 123
4.3.1 深度神经网络训练 ...................................................................... 123
4.3.2 网络社团发现算法 ...................................................................... 125
4.3.3 Bulk Iteration ................................................................................ 127
4.3.4 Delta Iteration 的迭代形式 .......................................................... 128
4.4 注解 ......................................................................................................... 130
4.4.1 直接转发 ...................................................................................... 130
4.4.2 非直接转发 .................................................................................. 131
4.4.3 触达 .............................................................................................. 132
4.5 思考题 ..................................................................................................... 132
第5 章 机器学习引擎架构与应用编程 ......................................................... 133
5.1 概述 ......................................................................................................... 133
5.1.1 数据加载 ...................................................................................... 134
5.1.2 多项式曲线拟合的例子 .............................................................. 135
5.2 流水线 ..................................................................................................... 137
5.2.1 机器学习面临的架构问题 .......................................................... 137
5.2.2 Scikit-learn 架构实践总结 .......................................................... 138
5.2.3 FlinkML 实现 ............................................................................... 140
5.3 深入分析多项式曲线拟合 ..................................................................... 170
5.3.1 数值计算的底层框架 .................................................................. 170
5.3.2 向量 .............................................................................................. 172
5.3.3 数据预处理 .................................................................................. 178
5.3.4 特征变换 ...................................................................................... 184
5.3.5 线性拟合 ...................................................................................... 188
5.4 分类算法 ................................................................................................. 190
5.4.1 最优超平面 .................................................................................. 190
5.4.2 凸优化理论 .................................................................................. 193
5.4.3 求解最优超平面 .......................................................................... 198
5.4.4 核方法 .......................................................................................... 200
5.4.5 软间隔 .......................................................................................... 205
5.4.6 优化解法 ...................................................................................... 208
5.4.7 SVM 的FlinkML 实现 ............................................................... 211
5.4.8 SVM 的应用 ................................................................................ 220
5.5 推荐算法 ................................................................................................. 221
5.5.1 推荐系统的分类 .......................................................................... 221
5.5.2 ALS-WR 算法 .............................................................................. 223
5.5.3 FlinkML 实现 ............................................................................... 225
5.5.4 ALS-WR 的应用 .......................................................................... 230
5.6 思考题 ..................................................................................................... 230
第6 章 关系型API ...................................................................................... 234
6.1 为什么需要关系型API .......................................................................... 234
6.2 Calcite ...................................................................................................... 235
6.3 关系型API 概述..................................................................................... 236
6.3.1 程序结构 ...................................................................................... 236
6.3.2 Table 运行时 ................................................................................ 239
6.3.3 表注册 .......................................................................................... 241
6.3.4 TableSource 与TableSink ............................................................ 242
6.3.5 查询 .............................................................................................. 244
6.3.6 相互转换 ...................................................................................... 244
6.4 动态表概述 ............................................................................................. 247
6.4.1 流式关系代数 .............................................................................. 247
6.4.2 动态表 .......................................................................................... 248
6.4.3 持续查询 ...................................................................................... 250
6.5 思考题 ..................................................................................................... 255
第7 章 复杂事件处理 .................................................................................. 256
7.1 什么是复杂事件处理 ............................................................................. 256
7.1.1 股票异常交易检测 ...................................................................... 256
7.1.2 重新审视DataStream 与Table API ............................................ 258
7.2 复杂事件处理的自动机理论 ................................................................. 259
7.2.1 有穷自动机模型NFA ................................................................. 259
7.2.2 NFAb 模型 .................................................................................... 261
7.2.3 带版本号的共享缓存 .................................................................. 263
7.3 FlinkCEP API .......................................................................................... 265
7.3.1 基本模式 ...................................................................................... 266
7.3.2 模式拼合 ...................................................................................... 267
7.3.3 模式分组 ...................................................................................... 268
7.3.4 匹配输出 ...................................................................................... 269
7.4 基于FlinkCEP 的股票异常交易检测的实现 ....................................... 270
7.5 思考题 ..................................................................................................... 274
第8 章 监控与部署 ...................................................................................... 275
8.1 监控 ......................................................................................................... 275
8.1.1 度量指标 ...................................................................................... 275
8.1.2 指标的作用域 .............................................................................. 279
8.1.3 监控配置 ...................................................................................... 279
8.2 集群部署模式 ......................................................................................... 281
8.2.1 Standalone .................................................................................... 281
8.2.2 YARN ........................................................................................... 281
8.2.3 高可用 .......................................................................................... 284
8.3 访问安全 ................................................................................................. 284
8.4 思考题 ..................................................................................................... 286
参考资料 ........................................................................................................ 287
· · · · · · (收起)

读后感

评分

评分

评分

评分

评分

用户评价

评分

我觉得相对市面上其他的关于flink初级的书来看,还是不错的!特别每一张后面的问题,让我有了自己的思考,带着问题去阅读,收益还是蛮多的。和张利兵编译的那本相比,这本无疑灵动多了,适合一个初学flink的技术从业者。

评分

垃圾 机翻了一遍官方文档 连检查都不检查一遍的那种机翻!!

评分

垃圾 机翻了一遍官方文档 连检查都不检查一遍的那种机翻!!

评分

真的垃圾,没有干货,缺乏逻辑

评分

官方文档简单翻译。字体间距放那么大,硬生生凑出了两百多页。全本书透露了四个字:浮躁,骗钱!

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有