计算机体系结构复习题(有答案) 联系客服

发布时间 : 星期三 文章计算机体系结构复习题(有答案)更新完毕开始阅读

计算机组成,主要指的是机器级内部数据流和控制流的组成及逻辑设计。它主要与计算机操作的并行度、重叠度及部件的共享度等有关,直接影响系统的速度与价格。

计算机实现是计算机组成的武力实现。它着眼于用什么样的器件技术和微组装技术。它也直接影响系统的速度和价格。

2.模拟和仿真能在结构不同的机器之间实现机器语言程序的移植。模拟是用机器语言程序解释另一机器的机器指令实现软件移植的方法。模拟方法在机器指令系统差异比较大时,会使程序运行速度严重下降。仿真是用微程序直接解释另一机器的机器指令实现软件移植的方法。仿真可以提高被移植软件运行速度,但及其结构差异较大时,很难实现。

区别是模拟用机器语言解释,其解释程序在主存中;仿真用微程序解释,其解释程序在控制存储器中。

3.峰值性能是指在理想的状况下计算机系统可获得的最高理论性能值,它不能真实反映系统的实际性能。

持续性能又称实际性能,使计算机系统可获得的平均理论性能值,通常用算术平均、几何平均、和调和平均三种方法表示 4.CISC设计风格的主要特点是: (1)指令系统复杂;

(2)绝大多数指令需要多个机器周期方可执行完毕; (3)各种指令都可访问存储器; (4)采用微程序控制;

(5)有专用寄存器;

(6)难以用优化编译器生成高效的目标代码程序。

RISC机的特点: (1)简化指令系统;

(2)除了LOAD/STORE指令外,所有指令都在一个时钟周期内执行完毕; (3)除了LOAD/STORE指令外,其余指令只与寄存器打交道; (4)绝大部分采用硬联线控制,不用或少用微程序实现;

(5)使用较多的通用寄存器,一般至少有32个,绝没有专用寄存器; (6)采用优化编译技术,生成高效的目标代码程序。 5.

计算机访存有两种局部性规律:

(1) 时间局部性:如果一个存储项被访问,则可能很快会再次被访问。

(2) 空间局部性:如果一个存储项被访问,则其领近的项也可能很快被访问。 存储器的层次结构是指:构成存储系统有n 种不同的存储器(M1~ M2)之间,增加辅助的软件或硬件,使之从应用程序员角度上看,他们在逻辑上是一个整体。使得存储层次的等效访问速度接近于最高层M1 ,容量接近于最底层Mn ,每位价格也接近于Mn ,典型的层次存储结构如:Cache存储器—〉主存—〉虚拟存储器。

6.实现软件移植的主要途径有:统一高级语言、采用系列机、模拟和仿真等。

统一高级语言:只能实现高级语言软件的移植,目前高级语言种类繁多,无法完全统一成一种。

系列机:由于系列内各档机器的结构变化不能太大,到一定时候会阻碍系列发展。只能实现在结构相同或相近的机器间的汇编语言应用软件的移植。

模拟:用宿主机的机器指令解释,机器语言差别大时,速度慢。

仿真:用宿主机的微程序解释,机器差别大时,仿真难、仿真效率和灵活性差。

7.一个由若干段组成的流水线,在达到稳定状态后所获得的吞吐率与其中延迟最大的那一

9

段长度有关,这一段就成为影响流水线速度的瓶颈。

消除流水线速度瓶颈的方法主要有两种:(1)尽量采取将瓶颈子过程再细分,使之接近于流水线其他段的工作速度。(2)将多个瓶颈子过程并联。 8.全局性相关是指转移指令与其后续指令之间的相关。 处理方法有:

(1)猜测法:猜中其中一条分支,预取指令。待条件码形成后决定是否继续执行。 (2)提前形成转移所需条件。

(3)加快短循环程序处理。

9.多处理机操作系统有主从型、独立监控型和浮动监控型3类。

主从型适合于工作负荷固定,逐级功能较强、从及功能较弱的异构型多处理机系统。 独立监控型适合于松耦合的多处理机系统。 浮动监控型适合于紧耦合的多处理机系统。

10.计算机系统的3T性能目标是:1 TFLOPS的计算能力, 1 TByte的主存容量,1 特TByte/s的I/O系统带宽。

11.“阿姆达尔定律”是指:系统中对某一部件采用某种更快执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频率,或所占总执行时间的比例。

实际上定义了采取增强某部分功能处理后可获得的性能改进或执行时间的加速比。即

12.RISC机在CPU内部设置大量寄存器和采用寄存器窗口重叠技术可以缩短CALL和RETURN语句的操作时间。采用寄存器窗口重叠技术,可在发生过程调用或返回时,过程参数能自动传送而不需要再用额外的传送时间,所以使处理器与存储器之间的代码传送量大大减少。

13.资源相关是指,当有多条指令进入流水线后在同一机器周期内争用同一功能部件所发生的冲突。

解决方法是:(1)后条指令停顿一派流水线;

(2)重复设置发生冲突的功能部件。 14.有时间重叠、资源重复、资源共享等三个途径。

时间重叠是让多个处理过程在实践上相互错开,轮流使用统一硬件设备的各个处理部分,以加快执行速度的方法。如流水线处理机CRAY-1。 资源重复是通过重复设置硬件资源来提高性能。如阵列处理机ILLIAC-Ⅳ。 资源共享是利用软件方法让多个用户共享同一套资源,来提高资源利用率和系统性能的。 如多道程序分时系统、多处理机、分布处理系统、计算机网等。

15.写回法:CPU只写入Cache,不写入主存,仅当Cache块替换时,才先写回主存后再替换。要求对每个Cache块增加一个修改位的资源开销。

全写法(写直达法):CPU每次写Cache的同时,也直接写入主存。要增加写主存的时间开销。

五、 1.sp?1(1?fe)?

fere?11?0.9?0.95?10.28?2.57

10

2.(1)禁止表F={2,4,6}, 冲突向量C=101010

最佳调度方案=(1,7)或(3,5),最小平均延迟= 4,最大吞吐率=1/4

(3) (1)SIMD系统:

乘法运算时间:4个PE并行执行:时间= 4

(PE1=A[1]B[1], PE2=A[2]B[2], PE3=A[3]B[3], PE4=A[4]B[4])

加法时间: 传送时间:(PE2—〉PE1 ,PE3—〉PE4 ,并行)= 1 加法时间:(PE1=PE2+PE1 ,PE4=PE3+PE4 ,并行)=2

加法时间:传送时间:(PE1—〉PE4 )=1

加法时间:(PE1=PE4+PE1)=2 最短执行时间=4+1+2+1+2=10(个时间单位),结果在PE1 处理单元中)

(2)MIMD系统:执行时间=10个时间单位。

3.单独流水:V3?存储器:1(启动访存)+6(访存)+1(打入V3)+ N-1 = 7+N V4?V0+V1:1(启动加)+6(加)+1(打入V4)+ N-1 = 7+N

V2?V4*V3:1(启动乘)+7(乘)+1(打入V2)+ N-1 = 8+N (1)(7+N)+(7+N)+(8+N)=22+3N(拍) (2)(7+N)+(8+N)=15+2N(拍)

(3)(7+1)+(8+N)=16+N(拍)

4.禁止表F={1,3,4,8} 冲突向量C=(10001101) 状态转换图:见图2-5-2 调度方案: 调度方案 平均延迟(拍) (2,5) (2,7) (5) (6,5) (6) (6,7) (7) (5,2) 3.5 4.5 5 5.5 6 6.5 7 3.5

最小平均等待时间=3.5拍, 最大吞吐率为Tp max=1/3.5(任武/拍) 最佳调度方案:(2,5)、(5,2)

5.配对关系: (0、2)是(000,010)

11

(1、3)是(001,011)

(4、6)是(100,110) (5、7)是(101,111)

规律是二进制编号为P2 P1 P0 的处理器与二进制编号为P2 P1 P0 的处理器配对交换数据。所以采用级控制多级立方体互连网络。

因为N=8,由n=log28=3级组成,每级二功能交换单元个数2N/2=4 ,互连函数为Cube(P2 P1 P0)= P2 P1 P0 ,第0、2级直通,第1级交换。即级控信号为P2 P1 P0=010

互连网络拓扑结构为:见教材图9.20

6.Huffman树图略。

14 等长操作码平均码长为log214=4位;Huffman编码平均码长为?pi?li?3.38位

i?1 采用两种码长的扩展操作码编码为:

000~101对应频度为0.15、0.15、0.14、0.13、0.12、0.11的指令操作码,110、111作为扩展码,在扩展出两位码:11000、11001、11010、11011;11100、11101、11110、11111

14分别对应频度较低的8条指令。平均码长为?pi?li?3?0.80?5?0.2?3.4位

i?1

12