并行程序设计原理 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:机械工业出版社

作者:[美] Calvin Lin

出品人:

页数:235

译者:陆鑫达

出版时间:2009-7

价格:45.00元

装帧:平装

isbn号码:9787111270751

丛书系列:计算机科学丛书

图书标签:

并行计算
并行
计算机
程序设计
计算机科学
编程
分布式计算
数据结构与算法
并行程序设计
原理
多核
并发
分布式
高性能
算法
编程
计算机
系统

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小美书屋

book.quotespace.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

《并行程序设计原理》内容新颖，涉及现代并行硬件和软件技术，包括多核体系结构及其并行程序设计技术。《并行程序设计原理》侧重论述并行程序设计的原理，并论述了并行程序设计中一些深层次问题，如可扩展性、可移植性以及并行程序设计应遵循的方法学等。

作者简介

目录信息

出版者的话
推荐序
译者序
前言
第一部分基础
第1章导论2
1.1 并行的威力和潜能2
1.1.1 并行，一个熟悉的概念2
1.1.2 计算机程序中的并行2
1.1.3 多核计算机，一个机遇3
1.1.4 使用并行硬件的更多机遇4
1.1.5 并行计算和分布式计算的比较4
1.1.6 系统级并行5
1.1.7 并行抽象的便利5
1.2 考察顺序程序和并行程序6
1.2.1 并行化编译器6
1.2.2 范例求解的变化7
1.2.3 并行前缀求和8
1.3 使用多指令流实现并行9
1.3.1 线程概念9
1.3.2 统计3的个数的多线程求解方法10
1.4 目标：可扩展性和性能可移植性17
1.4.1 可扩展性17
1.4.2 性能可移植性18
1.4.3 原理第一18
1.5 小结19
历史回顾19
习题19
第2章认识并行计算机21
2.1 用可移植性衡量机器特征21
2.2 6种并行机介绍21
2.2.1 芯片多处理器21
2.2.2 对称多处理器体系结构23
2.2.3 异构芯片设计26
2.2.4 机群27
2.2.5 超级计算机27
2.2.6 对6种并行计算机的评论30
2.3 顺序计算机的抽象30
2.3.1 应用RAM模型31
2.3.2 评估RAM模型31
2.4 PRAM：一种并行计算机模型32
2.5 CTA：一种实际的并行计算机模型32
2.5.1 CTA模型33
2.5.2 通信时延36
2.5.3 CTA的性质36
2.6 存储器访问机制37
2.6.1 共享存储器37
2.6.2 单边通信37
2.6.3 消息传递38
2.6.4 存储器一致性模型38
2.6.5 程序设计模型39
2.7 进一步研究通信40
2.8 CTA模型的应用40
2.9 小结41
历史回顾41
习题41
第3章性能分析43
3.1 动机和基本概念43
3.1.1 并行和性能43
3.1.2 线程和进程43
3.1.3 时延和吞吐率44
3.2 性能损失的原因45
3.2.1 开销45
3.2.2 不可并行代码46
3.2.3 竞争47
3.2.4 空闲时间47
3.3 并行结构48
3.3.1 相关性48
3.3.2 相关性限制并行性49
3.3.3 粒度50
3.3.4 局部性51
3.4 性能协调51
3.4.1 通信和计算52
3.4.2 存储器和并行性52
3.4.3 开销与并行52
3.5 性能度量53
3.5.1 执行时间54
3.5.2 加速比54
3.5.3 超线性加速比55
3.5.4 效率55
3.5.5 加速比问题55
3.5.6 可扩展加速比和固定加速比56
3.6 可扩展性能56
3.6.1 难于达到的可扩展性能57
3.6.2 硬件问题57
3.6.3 软件问题58
3.6.4 问题规模的扩展58
3.7 小结59
历史回顾59
习题59
第二部分并行抽象
第4章并行程序设计起步62
4.1 数据和任务并行62
4.1.1 定义62
4.1.2 数据和任务并行的说明62
4.2 Peril-L记号63
4.2.1 扩展C语言63
4.2.2 并行线程63
4.2.3 同步和协同64
4.2.4 存储器模型64
4.2.5 同步存储器66
4.2.6 归约和扫描67
4.2.7 归约的抽象68
4.3 统计3的个数程序实例68
4.4 并行性的表示68
4.4.1 固定并行性68
4.4.2 无限并行性69
4.4.3 可扩展并行性70
4.5 按字母顺序排序实例71
4.5.1 无限并行性71
4.5.2 固定并行性72
4.5.3 可扩展并行性73
4.6 三种求解方法的比较77
4.7 小结78
历史回顾78
习题78
第5章可扩展算法技术80
5.1 独立计算块80
5.2 Schwartz算法80
5.3 归约和扫描抽象82
5.3.1 通用归约和扫描举例83
5.3.2 基本结构84
5.3.3 通用归约结构86
5.3.4 通用扫描组件举例87
5.3.5 应用通用扫描88
5.3.6 通用向量操作89
5.4 静态为进程分配工作89
5.4.1 块分配90
5.4.2 重叠区域91
5.4.3 循环分配和块循环分配92
5.4.4 不规则分配94
5.5 动态为进程分配工作95
5.5.1 工作队列95
5.5.2 工作队列的变体97
5.5.3 案例研究：并发存储器分配97
5.6 树99
5.6.1 按子树分配99
5.6.2 动态分配100
5.7 小结100
历史回顾100
习题101
第三部分并行程序设计语言
第6章线程程序设计104
6.1 POSIX Threads 104
6.1.1 线程的创建和销毁104
6.1.2 互斥108
6.1.3 同步110
6.1.4 安全性问题117
6.1.5 性能问题120
6.1.6 案例研究1：连续过度松弛124
6.1.7 案例研究2：重叠同步与计算129
6.1.8 案例研究3：多核芯片上的流计算..134
6.2 Java Threads 134
6.2.1 同步方法135
6.2.2 同步语句136
6.2.3 统计3的个数程序实例136
6.2.4 易变存储器138
6.2.5 原子对象138
6.2.6 锁对象138
6.2.7 执行器138
6.2.8 并发集合138
6.3 OpenMP 138
6.3.1 统计3的个数程序实例139
6.3.2 parallel for的语义局限141
6.3.3 归约141
6.3.4 线程的行为和交互142
6.3.5 段142
6.3.6 OpenMP总结143
6.4 小结143
历史回顾143
习题143
第7章 MPI和其他局部视图语言145
7.1 MPI：消息传递接口145
7.1.1 统计3的个数程序实例145
7.1.2 组和通信子152
7.1.3 点对点通信152
7.1.4 集合通信154
7.1.5 举例：连续过度松弛157
7.1.6 性能问题159
7.1.7 安全性问题164
7.2 分区的全局地址空间语言164
7.2.1 Co-Array Fortran165
7.2.2 Unified Parallel C 166
7.2.3 Titanium 167
7.3 小结167
历史回顾168
习题168
第8章 ZPL和其他全局视图语言169
8.1 ZPL程序设计语言169
8.2 ZPL基本概念169
8.2.1 区域170
8.2.2 数组计算171
8.3 生命游戏实例173
8.3.1 问题173
8.3.2 解决方案173
8.3.3 如何实现174
8.3.4 生命游戏的哲学175
8.4 与众不同的ZPL特征175
8.4.1 区域175
8.4.2 语句级索引175
8.4.3 区域的限制176
8.4.4 性能模型176
8.4.5 用减法实现加法177
8.5 操作不同秩的数组177
8.5.1 部分归约177
8.5.2 扩充178
8.5.3 扩充的原理179
8.5.4 数据操作举例179
8.5.5 扩充区域180
8.5.6 矩阵乘181
8.6 用重映射操作重排数据182
8.6.1 索引数组183
8.6.2 重映射183
8.6.3 排序举例185
8.7 ZPL程序的并行执行186
8.7.1 编译器的职责186
8.7.2 指定进程数187
8.7.3 为进程分配区域187
8.7.4 数组分配188
8.7.5 标量分配188
8.7.6 工作分派188
8.8 性能模型189
8.8.1 应用实例1：生命游戏190
8.8.2 应用实例2：SUMMA算法190
8.8.3 性能模型总结191
8.9 NESL并行语言191
8.9.1 语言概念191
8.9.2 用嵌套并行实现矩阵乘192
8.9.3 NESL复杂性模型192
8.10 小结192
历史回顾193
习题193
第9章对并行程序设计现状的评价194
9.1 并行语言的四个重要性质194
9.1.1 正确性194
9.1.2 性能195
9.1.3 可扩展性196
9.1.4 可移植性196
9.2 评估现有方法196
9.2.1 POSIX Threads 196
9.2.2 Java Threads 197
9.2.3 OpenMP 197
9.2.4 MPI 197
9.2.5 PGAS语言198
9.2.6 ZPL 198
9.2.7 NESL 199
9.3 可供将来借鉴的经验199
9.3.1 隐藏并行199
9.3.2 透明化性能200
9.3.3 局部性200
9.3.4 约束并行200
9.3.5 隐式并行与显式并行201
9.4 小结201
历史回顾201
习题202
第四部分展望
第10章并行程序设计的未来方向204
10.1 附属处理器204
10.1.1 图形处理部件204
10.1.2 Cell处理器207
10.1.3 附属处理器的总结207
10.2 网格计算208
10.3 事务存储器209
10.3.1 与锁的比较210
10.3.2 实现方法210
10.3.3 未解决的问题211
10.4 MapReduce 212
10.5 问题空间的提升214
10.6 新出现的语言214
10.6.1 Chapel215
10.6.2 Fortress 215
10.6.3 X10216
10.7 小结218
历史回顾218
习题218
第11章编写并行程序219
11.1 起步219
11.1.1 访问和软件219
11.1.2 Hello, World 219
11.2 并行程序设计的建议220
11.2.1 增量式开发220
11.2.2 侧重并行结构220
11.2.3 并行结构的测试221
11.2.4 顺序程序设计221
11.2.5 乐意写附加代码222
11.2.6 测试时对参数的控制222
11.2.7 功能性调试223
11.3 对结课课程设计的设想223
11.3.1 实现现有的并行算法223
11.3.2 与标准的基准测试程序媲美224
11.3.3 开发新的并行计算224
11.4 性能度量225
11.4.1 与顺序求解方法比较226
11.4.2 维护一个公正的实验设置226
11.5 了解并行性能227
11.6 性能分析227
11.7 实验方法学228
11.8 可移植性和微调229
11.9 小结229
历史回顾229
习题229
术语表230
参考文献234
· · · · · · (收起)

读后感

评分☆☆☆☆☆

用户评价

评分☆☆☆☆☆

我是在一个高强度、高并发的服务重构项目中引入这本书的。当时我们团队正面临着一个棘手的性能瓶颈，所有的优化尝试似乎都陷入了僵局，陷入了那种“感觉有锁冲突，但又抓不住证据”的窘境。这本书及时地为我们提供了“侦探工具”。书中对于并发调试和性能剖析方法的介绍，远超出了普通工具手册的范畴，它教授的是一种**观察并发世界**的方法论。作者强调了诸如“时间旅行调试”、“延迟敏感性分析”等高级技术在定位瞬时性竞态条件中的作用。我们根据书中提到的经验法则，重新设计了我们的监控指标和日志记录策略，并成功地定位到了一个隐藏在低级别系统调用中的非预期依赖。说实话，这本书带来的不仅仅是知识的增长，更是一种解决问题的**工程哲学**的转变——从“修补”到“预见”。它让你学会像一个怀疑论者一样去审视自己的代码，时刻警惕那些看似无害的并行假设。

评分☆☆☆☆☆

与其他偏重特定语言或框架的并发书籍不同，这部作品的理论根基极为深厚且具有极强的跨平台性。我发现自己过去在C++、Java和Go语言中遇到的各种并发陷阱，都能在这本书的通用原理中找到其源头。作者似乎对计算机科学的经典理论有着深刻的理解，并将这些理论巧妙地融入到现代计算的语境中。例如，关于原子操作的讨论，没有仅仅停留在`std::atomic`或`java.util.concurrent`的API层面，而是追溯到了CAS（Compare-and-Swap）指令的硬件实现机制，并分析了其在不同内存一致性模型下的效率差异。这种从底层硬件到上层软件设计模式的贯通，使得书中内容具有惊人的生命力，它不会因为某一个新框架的出现而迅速过时。对于致力于成为一名领域专家的读者而言，这种“不变的真理”比追逐最新的技术热点更有价值，它提供了一种抵御技术迭代焦虑的内在定力。

评分☆☆☆☆☆

这本书的结构安排简直是教科书级别的典范，逻辑递进非常自然流畅，完全没有那种为了凑字数而堆砌章节的痕迹。从最基础的并行任务分解方法论开始，逐步过渡到不同并行模型（如共享内存与消息传递）的优缺点对比，最后收束于分布式环境下的容错与一致性挑战。我特别欣赏作者对“抽象层次”的精妙掌控，他似乎总能在读者感到困惑时，及时退后一步，用一个更高级的视角来重新审视问题，然后再深入细节进行剖析。对于初学者而言，这提供了足够的缓冲和引导；对于资深人士来说，这种层次感的切换也带来了一种重新校准认知的机会。我几乎可以想象作者在写作过程中，是如何精心设计每一个知识点的引入顺序的，确保读者在接触复杂概念之前，已经具备了必要的认知基础。这种严谨的学术态度和清晰的表达能力，让整本书读起来如同在欣赏一件结构精巧的艺术品，每一个部分都各司其职，却又浑然一体。

评分☆☆☆☆☆

这部著作简直是为我这种理论功底稍显薄弱，但在实际工程中又不得不面对复杂并发问题的开发者量身定制的。它并非那种枯燥乏味的教科书，堆砌着晦涩难懂的数学公式和晦涩的理论模型。相反，作者的叙事方式极为平易近人，仿佛一位经验丰富的前辈，在你耳边娓娓道来那些隐藏在高性能计算背后的底层逻辑。我尤其欣赏它在讲解同步原语时所采用的类比——那些关于“资源争夺”和“信息传递”的生动场景，瞬间将抽象的概念具象化了。书中对死锁、活锁和饥饿等经典并发问题的剖析，也做到了深入浅出，每一个案例都像是从真实的生产环境中截取出来，让人产生强烈的代入感。阅读过程中，我时不时会停下来，在脑海中模拟那些线程交错执行的路径，这对于巩固理解至关重要。这本书最大的价值在于，它不仅仅告诉你“怎么做”，更重要的是解释了“为什么必须这么做”，从而构建起一个坚实的、可迁移的并发思维框架。我感觉自己不再是那个仅仅会调用API的“调包侠”，而是开始理解驱动这些调用的底层机制的架构师了。

评分☆☆☆☆☆

坦率地说，我最初抱着一种怀疑的态度拿起这本书的，毕竟市面上关于并行计算的书籍汗牛充栋，大多数都是在重复已被嚼烂的知识点。然而，这本书展现出了令人惊喜的广度和深度。它没有停留在传统的互斥锁和信号量这些基础层面，而是大胆地探索了更前沿的领域，比如无锁数据结构的设计哲学，以及在多核异构计算环境下，如何权衡数据一致性与程序性能的微妙平衡。我记得有一章专门探讨了内存模型（Memory Model）对程序行为的决定性影响，那部分的论述极其精辟，它清晰地揭示了编译器和处理器优化是如何在“看不见的地方”悄悄改变我们的代码执行顺序的。作者在引用现代CPU架构特性时，总是能找到最恰当的时机，将理论与硬件特性紧密结合，这极大地提升了内容的实用价值。对于那些渴望将自己的并发程序推向极致性能的工程师来说，这本书无疑提供了一张详尽的、且充满洞察力的“优化地图”。它强迫你跳出对操作系统抽象层的依赖，直接去思考机器指令层面可能发生的交互。

评分☆☆☆☆☆

主要介绍了并行程序设计时要面临的问题，并比较了一些策略

评分☆☆☆☆☆

这是关于并行方面很新的书了，内容新，而且确实很原理。

评分☆☆☆☆☆

比较偏重理论，比较复杂，需要耐下心来慢慢看，慢慢理解，如果真的对并行有兴趣，这的确是一本好书！

评分☆☆☆☆☆

入门导引,学院派..

评分☆☆☆☆☆

浏览