并行计算(陈国良版)课后答案

发布时间 : 星期二 文章并行计算(陈国良版)课后答案更新完毕开始阅读

3)机群作业和外来作业;

4)专用模式、空间共享模式、时间共享模式; 5)独立调度与组调度。 答:

1) 串行作业在单节点上运行,并行作业使用多个节点。

2) 批处理作业通常需要较多的资源,如大量的内存和较长的CPU时间,但不需要迅速的

反应;交互式作业要求较快的周转时间,其输入输出直接指向终端设备,这些工作一般不需要大量资源,用户期望它们迅速得到执行而不必放入队列中。 3) 机群作业时通过使用JMS功能分布实现的用户作业,用户服务器位于任一主机节点,资

源管理器跨越所有的机群节点。外来作业在JMS之外生成的,如NOW上的一个工作站拥有者启动的外部作业,它不提交给JMS。

4) 专用模式:任一时候只有一个作业在机群上运行,任一时候也只有一个作业进程分配给

一个节点。空间共享模式:多个作业可以在不重叠的节点区域上运行。时间共享模式:在专用模式和空间共享模式下,只有一个用户进程分配给一个节点,但是所有的系统进程或监护程序仍在同一个节点上运行。

5) 独立调度:各节点OS进行自己的调度,但这会显著损坏并行作业的性能,因为并行作

业的进程间需要交互。组调度:将并行作业的所有进程一起调度。一个进程激活时,所有进程都被激活。

6.5 针对LSF回答下列问题:

1)对LSF的四种作业类型各举一个例子; 2)举一个例子说明外来作业;

3)对一个有1000个服务器的机群,为什么LSF负载分配机制优于:1整个机群只有一个LIM或者2所有LIM都是主机?说明原因。 答:

1) 交互式:用户使用lshosts命令就可以列出每个服务器节点的静态资源,实现交互。批处

理:lsbatch实用程序允许通过LSF提交、监控和执行批处理作业。串行:用户一旦进入lstcsh shell,发送的每条命令自动在最适合的节点上执行。并行:lsmake实用程序是UNIX make实用程序时一个并行版本,允许在多个节点同时处理一个Makefile。

2) 不通过LSF执行的称为外来作业。例如执行一些本地作业:字处理,web网络浏览等。 3) 机群的服务器数目太多,如果只采用一个LIM会导致LIM的负责过重,不能及时的处

理响应所有服务器的请求和分派所有机群作业;如果采用2会导致LIM之间相互交换负载信息过多,导致网络通信量过大。

6.6 为什么在分布式文件系统中,UNIX语义难以实现?有哪些放松的文件共享语义?采用放松的文件共享语义会有一些什么缺点? 答:

在UNIX语义中,一个修改过的块应该立刻被所有其他应用程序见到。然而分布式的文件系统中,多个节点可能存放了同一文件块的拷贝,当其中一个节点修改文件可的拷贝时,其他节点不能立刻就知道,这就使得UNIX语义难以实现。放松的文件共享语义有:对话语义、类事物语义、不可改变的共享文件语义等。采用放松的文件共享语义要求应用程序员修改程序代码,以适用这种新的语义,这就增加了程序员的负担。

6.7 试解释在机群并行文件系统中,为什么采用软件RAID、高速缓存机制和预取能够提高

9

文件系统性能。

答:

软件RAID是文件系统负责分布数据和维护容错级别,能够和RAID5有一样的性能,实现机群磁盘间的数据分布,提高了I/O系统的传输带宽。高速缓存是将应用程序要取的块放在CACHE中,根据局部性原理,应用程序可以基本上从CACHE中读取数据块,而不要通过读取内存或硬盘,提高了读取速度。预取是在真正读取数据块之前就将这些数据块读入内存,这也提高了I/O性能,改善了文件系统性能。

6.8 讨论并行文件系统协作化高速缓存的基本技术前提是什么?这个前提有什么意义? 答:

基本技术前提是互联网络的速度很快,一个节点需要的文件块在其他节点的缓存中,那么就不需要从磁盘读,而是直接从其他节点的缓存中读出。这个前提的意义是可以提高系统的性能,使得节点间的协作化缓存变得更有意义。

6.9 回答以下关于Berkeley NOW项目的问题:

1)Berkeley NOW项目支持单一系统映像的哪几个方面?即单入口点、单文件层次结构、单控制点、单存储空间、单进程空间哪个的哪几项?并解释如何支持。 2)解释Berkeley NOW项目用来提高性能的四个结构特征。

3)解释Berkeley NOW项目和SP机群四个体系结构的差异,并讨论各自的优点。 答:

1) 通过用户级整个机群软件GLUNIX,提供单一系统映像。开发了一种新的无服务器网络

文件系统xFS,以支持单一文件层次结构。

2) 主动消息通信协议,支持有效的通信;机群软件GLUNIX提供单一的系统映像、资源管

理和可用性;xFS支持可扩放性和单一文件层次结构的高可用性;软件框架WebOS构筑高可用性、渐增可扩放性。

3) SP机群的体系结构特征:每个节点都是RS/600工作站,并有自己的局部磁盘;每个节

点内驻留一个完整的AIX;各节点通过其I/O总线连接到专门设计的多级高速网络;尽量使用标准工作站部件。这样的优点是简单性和灵活性。

6.10考虑xFS,并回答下列问题:

1)解释xFS和集中式文件服务器的两个不同点,并讨论各自的优点; 2)解释xFS用来提高可用性的主要技术; 3)解释xFS用来减轻小—写问题的主要技术。 答:

1) 无服务器文件系统xFS将文件服务的功能分布到机器的所有节点上,xFS中所有的服务

器和客户的功能由分散的所有节点实现之。这与集中文件服务器的中央存储、中央缓存、中央管理不同。xFS的优点是采用分布式管理和协同文件缓存以及冗余磁盘阵列,这提高了系统的可用性以及I/O的性能和吞吐量。集中式文件服务器会减少缓存的不一致性,管理简单。

2) xFS提高可用性的主要技术是采用廉价冗余磁盘阵列RAID。无工作站文件系统能用来

生成软件RAID,以提高性能和高可用性。现在xFS使用单奇偶校验磁盘条。一个文件数据块在多个存储服务器节点上按条划分,在另一个节点上有奇偶校验块。如果一个节点失效,失效磁盘的内容,可利用其余盘和奇偶盘之异或操作重建之。

3) xFS使用日志条的方法解决小—写问题:每个用户首先将写接合到各用户的日志上;然

后此日志采用日志段提交给磁盘,每个段系由K-1个日志片组成,它与奇偶校验片以道

10

送给K个存储服务器。

第七章 分布式共享存储系统

7.1什么是分布式共享存储系统,它相对于共享存储系统与分布式系统有哪些优点?

答:分布式共享存储系统,是把共享存储器分成许多模块并分布于各处理机之中。分布式系统中采用消息传递通信,性能提高了,但多地址空间不利于程序员编程。共享存储系统支持传统的单地址空间,但共享必然引起冲突,形成瓶颈,于是分布式共享存储系统结合两者的优点。

7.2释放一致性模型(RC)把处理器一致性(PC)和弱一致性模型(WC)的优点结合在一起了。

试回答下面有关这些一致性模型的问题: a) 比较这三种一致性模型的实现要求。 b)评论每种一致性模型的优缺点。

答:a)处理器一致性要求:①在任一取数操作LOAD允许被执行之前,所有在同一处理器中先于这一LOAD的取数操作都已完成;②在任一存数操作STORE允许执行之前,所有在同一处理器中先于这一STORE的访存操作(包括取数操作和存数操作)都已完成。弱一致性模型要求:①同步操作的执行满足顺序一致性条件;②在任一普通访存操作允许被执行之前,所有在同一处理器中先于这一访存操作的同步操作都已完成;③在任一同步操作允许被执行之前,所有在同一处理器中先于这一同步操作的普通访存操作都已完成。释放一致性模型要求:①在任一普通访存操作允许被执行之前,所有在同一处理器中先于这一访存操作的获取操作acquire都已完成;②在任一释放操作release允许被执行之前,所有在同一处理器中先于这一release的普通访存操作都已完成;③同步操作的执行满足顺序一致性条件。 b)三种模型对存储顺序要求逐渐降低,可优化程度逐渐增加,但是对程序员的要求也越来越高,所以释放性一致性是性能与复杂度的折中。

7.3在DSM系统的顺序一致性存储模型下,有三个并行执行的进程如下所示,试问001110是不是一个合法的输出?并加以解释。

P1 P2 P3

A=1; Print(b,c);

B=1; Print(a,c);

C=1; Print(a,b);

答:不是一个合法输出。考虑顺序一致性存储模型,每个进程的程序序会被维护,那么无论

哪个进程最后执行Print语句,则之前的A=1,B=1,C=1都已经完成,所以输出的两后两项必为11,所以001110不是合法输出。

7.4试分类下面来自三个处理器的引用流的高速缓存缺失。假设每一个处理器的高速缓存只有一个4个字的高速缓存行,字W0到W3、W4到W7分别处于同一个高速缓存行。

如果一行有多个引用,我们假设P1在P2之前发射、P2在P3之前发射内存引用,符号 LD/ST Wi表示LOAD/STORE 字i。 操作序号 1 2 3 4 5 6

P1 ST W0 LD W6 LD W2 LD W2 P2 LD W2 LD W7 LD W0 ST W2 P3 ST W7 11

7 8 9 10 11 12 13 14 15 ST W2 ST W5 LD W7 LD W2 LD W5 LD W3 LD W6 LD W2 LD W5 LDW5 LD W7 LD W2 ST W7 LD W2 答:操作序号3、6、8、12-15都是单操作。操作序号1、2、9-11为无关存储操作,由于不在同一块中。操作序号4、7为对同一缓存块的连续两次LD,需要按序进行。

7.5假设系统中共有512个处理器和1GB主存,每个节点内有8个处理器对目录可见,一个高速缓存行的大小为64字节,那么在(a) 满位向量方案和(b) DriB(i=3)模型下目录的存储成本各是多少?

答:分别为总容量的12.%和5.47%。

7.6 细数一下中心目录与分布式目录方案的实现方法与各自的使用情况。 答:中心目录是用一个中心目录存放所有高速缓存目录的拷贝,中心目录能提供为保证一致性所需要的全部信息。因此,其容量非常大且必须采用联想方法进行检索,这和单个高速缓存的目录类似。大型多处理机系统采用中心目录会有冲突和检索时间过长两个缺点。

分布式目录方案是由Censier和Feautrier提出来。在分布式目录中每个存储器模块维护各自的目录,目录中记录着每个存储器块的状态和当前的信息,其中状态信息是本地的,而当前信息指明哪些高速缓存中有该存储器块的拷贝。

一般来说,在共享存储上实现中心目录,而在分布式系统上实现分布式目录方案更为合适一些,但这也并不是绝对的。

7.7在研究DSM的读写代价和实现问题时有这样两种算法,即中央服务器算法和迁移算法:中央服务器算法是指使用一个中央服务器,负责为所有对共享数据的访问提供服务并保持共享数据唯一的副本;迁移算法是指要访问的数据总是被迁移到访问它的节点中。两种算法图示如下:

中央服务器算法

顾客 发送数据请求 接收应答 中央服务器 接收请求 执行数据访问,发送应答 迁移算法 顾客 如果高速缓存行不在本地,则确定位置,发送请求 接收回答,访问数据 接收请求,发送高速缓存行 远程主机 现假设报文数量不会导致网络阻塞,服务员的阻塞没有严重到能够极大地延迟远程12

联系合同范文客服:xxxxx#qq.com(#替换为@)