Advertisement

哈尔滨工程大学研究生并行体系结构期末考试资料(并行体系结构11.docx)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:DOCX


简介:
本资料为哈尔滨工程大学研究生课程《并行体系结构》期末考试复习材料,涵盖教学大纲核心知识点与例题解析,适用于备考使用。 哈工程研究生并行体系结构期末考试知识点总结 一、并行计算模型 PRAM 模型(并行随机访问机模型):机器规模 n 可任意大;基本时间步称为周期;在一个周期内每个处理器只执行一条指令;每一周期内所有处理器同步,同步开销为零;一条指令可以是任何随机访问指令。 BSP 模型(块同步模型):基本时间步是超步,包括计算、通信和路障;它是松同步、非零开销,并且可变颗粒度的 MIMD 机器模型。 二、并行计算性能 SP2 的点对点通讯表达式为 t(m)=46+0.035m。启动开销 t0=46 μs,渐进带宽 r∞=1/0.035≈28.57MB/s,半峰值消息长度 m12=t0*r∞=1314B。 三、Amdahl 定律 固定问题规模的 Amdahl 定律:Sn=Wα/(W+(1-α) W n)=n / (1 + (n - 1)* α ) → 1/α,当 n→∞ 含义: 对于给定的工作负载,其最大加速比的上限为 1/α。 为了获取好的加速比,应使顺序瓶颈 α 尽可能地小。 如果一个问题由两部分组成,则应设法让较大那部分执行得更快。 考虑开销 T0 的固定问题规模 Amdahl 定律:Sn=W*α/(W+(1-α) W n)+T 0 =n / (1 + (n - 1)* α )+ n *T 0/W→1/α + T 0/W,当 n→∞ 四、基准程序 按应用类型分类有科学计算、商业应用、网络服务和多媒体应用等。 按照计算机系统来分有两种:宏基准程序和微基准程序。 宏基准程序测量的是一个计算机系统的总体性能,但不能揭示导致其运行好坏的原因;而微基准程序则专注于衡量某一方面的性能如 CPU 速度或存储器速度。 五、并行程序中的开销 在并行计算中可以将开销分为三类:负载不平衡开销,并行性相关开销以及交互操作相关的同步和通信等。 额外的并行化成本包括了并行性和交互两个方面。 六、PRAM 步中的计算复杂性 假设存在三个 PRAM 算法 A, B 和 C,当在有 n 个处理器的 PRAM 计算机上执行时,各自的时间复杂度分别为A--7n,B--(nlogn)/4和C--nloglogn。 根据大O符号:算法A最快为 O(n),接着是 C 即 O(n log(log n)),而 B 最慢即 O(n log n)。 七、并行处理中的通信开销 在进行并行处理时通常认为随着使用的节点数量增加,通讯成本也会随之上升。然而通过实例可以发现这种观点可能是错误的。 例如,在 APT 程序中当使用不超过256个结点时,总的通信量会随机器规模增大而减少。 八、系统性能分析 对于拥有 256 个节点的系统,T0(∞)= T0(256) = 0.0479 秒 计算最大并行性、总工作负载、执行时间、关键路径长度、最大性能值以及平均并行性和颗粒度。 假设忽略通信开销,则加速比(串行时间/ 并行时间)可以用来衡量系统效率。 需要求解该系统的运行时间和加速比分别是多少。 结论:固定负载下的加速比会随着顺序瓶颈和平均开销的增加而急剧下降,单纯通过添加更多的处理器来解决顺序瓶颈问题是无效的。可以通过同时增大机器规模并提高可并行计算的比例来改善性能。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 11.docx
    优质
    本资料为哈尔滨工程大学研究生课程《并行体系结构》期末考试复习材料,涵盖教学大纲核心知识点与例题解析,适用于备考使用。 哈工程研究生并行体系结构期末考试知识点总结 一、并行计算模型 PRAM 模型(并行随机访问机模型):机器规模 n 可任意大;基本时间步称为周期;在一个周期内每个处理器只执行一条指令;每一周期内所有处理器同步,同步开销为零;一条指令可以是任何随机访问指令。 BSP 模型(块同步模型):基本时间步是超步,包括计算、通信和路障;它是松同步、非零开销,并且可变颗粒度的 MIMD 机器模型。 二、并行计算性能 SP2 的点对点通讯表达式为 t(m)=46+0.035m。启动开销 t0=46 μs,渐进带宽 r∞=1/0.035≈28.57MB/s,半峰值消息长度 m12=t0*r∞=1314B。 三、Amdahl 定律 固定问题规模的 Amdahl 定律:Sn=Wα/(W+(1-α) W n)=n / (1 + (n - 1)* α ) → 1/α,当 n→∞ 含义: 对于给定的工作负载,其最大加速比的上限为 1/α。 为了获取好的加速比,应使顺序瓶颈 α 尽可能地小。 如果一个问题由两部分组成,则应设法让较大那部分执行得更快。 考虑开销 T0 的固定问题规模 Amdahl 定律:Sn=W*α/(W+(1-α) W n)+T 0 =n / (1 + (n - 1)* α )+ n *T 0/W→1/α + T 0/W,当 n→∞ 四、基准程序 按应用类型分类有科学计算、商业应用、网络服务和多媒体应用等。 按照计算机系统来分有两种:宏基准程序和微基准程序。 宏基准程序测量的是一个计算机系统的总体性能,但不能揭示导致其运行好坏的原因;而微基准程序则专注于衡量某一方面的性能如 CPU 速度或存储器速度。 五、并行程序中的开销 在并行计算中可以将开销分为三类:负载不平衡开销,并行性相关开销以及交互操作相关的同步和通信等。 额外的并行化成本包括了并行性和交互两个方面。 六、PRAM 步中的计算复杂性 假设存在三个 PRAM 算法 A, B 和 C,当在有 n 个处理器的 PRAM 计算机上执行时,各自的时间复杂度分别为A--7n,B--(nlogn)/4和C--nloglogn。 根据大O符号:算法A最快为 O(n),接着是 C 即 O(n log(log n)),而 B 最慢即 O(n log n)。 七、并行处理中的通信开销 在进行并行处理时通常认为随着使用的节点数量增加,通讯成本也会随之上升。然而通过实例可以发现这种观点可能是错误的。 例如,在 APT 程序中当使用不超过256个结点时,总的通信量会随机器规模增大而减少。 八、系统性能分析 对于拥有 256 个节点的系统,T0(∞)= T0(256) = 0.0479 秒 计算最大并行性、总工作负载、执行时间、关键路径长度、最大性能值以及平均并行性和颗粒度。 假设忽略通信开销,则加速比(串行时间/ 并行时间)可以用来衡量系统效率。 需要求解该系统的运行时间和加速比分别是多少。 结论:固定负载下的加速比会随着顺序瓶颈和平均开销的增加而急剧下降,单纯通过添加更多的处理器来解决顺序瓶颈问题是无效的。可以通过同时增大机器规模并提高可并行计算的比例来改善性能。
  • (威海)软件
    优质
    本课程资料由哈尔滨工业大学(威海)精心编制,涵盖软件体系结构的核心理论与实践技能,旨在培养学生设计、实现及评估复杂系统的能力。 哈工大(威海)国家示范性软件学院孙玉山教授的软件体系结构课件结合了卡内基梅隆大学和华盛顿大学的软件工程授课内容,并通过实际工业开发案例诠释了软件体系结构的应用,希望大家学习后能有所收获。
  • 陈国良的计算机
    优质
    《陈国良的并行计算机体系结构研究》一书聚焦于著名计算机科学家陈国良教授在此领域的贡献与成果,深入探讨了并行计算的关键理论和技术。 国防科技大学陈国良的《并行计算机体系结构》书籍非常经典。
  • 软件A卷
    优质
    本试卷为《软件体系结构》课程的期末考核题集,旨在全面评估学生对软件设计、架构模式及系统集成等核心概念的理解与应用能力。 软件体系结构期末测验A卷
  • 计算机数据真题.zip
    优质
    本资源包含哈尔滨工程大学计算机专业硕士研究生入学考试中数据结构科目的历年真题,适合备考哈工程计算机考研的学生使用。 哈尔滨工程大学计算机考研初试的数据结构真题涵盖了从1998年至2020年的所有题目。这里仅提供真题,不包括答案。答案可以在发布的资源中下载获取。
  • 的计算机PPT
    优质
    本PPT为哈尔滨工程大学计算机系统结构课程资料,涵盖计算机硬件组成、工作原理及性能优化等内容,旨在帮助学生深入理解与掌握计算机体系架构知识。 哈尔滨工程大学计算机系统结构期末复习PPT的内容可以帮助同学们更好地准备考试。