1、一 填空题(每空 1 分,共 30 分)1、系列机是指具有相同的 体系结构 ,但具有不同 组织和实现 的一系列不同型号的机器。2、存储程序计算机结构上的主要特点之一是以运算器为中心。3、从计算机系统结构的多级层次结构可知,通常情况下,第 1、2、3 级用 解释 方法实现,第 4 或更高级用 翻译 方法实现。4、对于最常见的事件,通常赋予它优先的处理权和资源使用权,这是计算机体系结构设计中的 大概率事件优先 原则。5、容量为 64 块的 Cache 采用组相联方式映像,字块大小为 128 字节,每 4 块为一组,若主存容量为 4096 块,且以字编址,那么主存地址为 19 位,主存区号为 6 位
2、。6、可改进比例的值总是 小于等于 1 。7、一般有两种策略来保存寄存器的内容,即: 调用者保存 和 被调用者保存 。8、DLX 指令集提供了 立即数寻址 、 寄存器寻址 、 偏移寻址和 寄存器间接寻址 4 种寻址方式。9、对某流水线处理器测试时发现其存在结构冲突,通常可采用 资源重复和流水化功能单元方法解决该问题。10、编译器通过重新组织代码顺序消除暂停的技术被称为 指令调度 。11、按照流水的级别可以把流水线分为 部件级流水线、处理机级流水线 和 处理机间流水线 。12、为解决流水线使用非流水数据通路的寄存器引起冲突,在流水线设计中采用 寄存器文件 技术解决该问题。13、Cache 的替换
3、算法常见的有 FIFO 、LRU 和 随机法 。14、改进 Cache 性能的方法主要有 降低失效率 、减少失效开销 和减少 Cache 命中时间。 15、减少流水线处理分支暂停时钟周期数的途径包括 尽早判断分支转移是否成功 和 尽早计算出分支成功转移的 PC 值 。二、选择题(115 题,每题 1 分,共 15 分)1、下面的指令中, A 不属于 RISC 处理器指令集。.ADD R4,1000 .LD R3,(R4) .SUB R4,R3 .SD 0(R3),R42. 在其它部件性能保持不变的情况下,对 CPU 性能的不断改进并没有获得期望的结果,这主要是受到了 A 的影响。A.Amdah
4、l 定律 B.流水线 C.指令集 D.体系结构3、对 cache 性能进行分析时,我们发现 A 不受 cache 容量的影响。A强制性失效 B容量失效 C冲突失效 D3C 失效4、若某 CPU 只有一个存储器,采用 DLX 流水线并执行如下的程序段,SD (R1),R2 LD R3,(R1)#4ADD 0(R1),#8SUB R3,R1;则该程序段中指令和指令的关系属于 A 。A 数据相关 B 名相关 C 控制相关 D 结构相关5、 在下列存储器中访问速度最慢的是 D 。A Cache B SDRAM C DRAM D Flash6、最近计算机上采用的 SSD(固态硬盘)实质上是 A 存储器
5、。AFlash B磁盘 C磁带 D光盘7、计算机使用总线结构的主要优点是便于实现积木化,同时 C 。A减少了通信传输量 B提高了通信传输的速度C减少了通信传输线的条数 D有利于芯片中布线8、下面关于流水线的说法不正确的是 D 。A 流水线由若干个“段”或“级”组成 B 流水线有“通过时间”C 流水线的“各段时间”应尽量相等 D 流水线的”深度”越多越好9、我们常说的 32 位处理器是指处理器的 A 是 32 位的。A 数据总线 B 控制总线 C 地址总线 D 所有的总线10、科学计算中采用向量处理机的主要原因是 A 较少。数据相关 控制相关 结构相关 非向量处理机11、为了便于实现多级中断,保
6、存现场信息最有效的方法是采用_B_.。A通用寄存器 B 堆栈 C.存储器 D.外存12、在下面描述的 RISC 指令系统基本概念中不正确的表述是 A 。A选取使用频率低的一些复杂指令,指令条数多。B指令长度固定C指令功能简单D指令运行速度快13、在下述 I/O 控制方式中,主要由程序实现的是 B 。AI/O 处理机方式 B中断方式 CDMA 方式 D通道方式14、以下属于降低 Cache 失效率的方法是 B 。A子块放置技术 B编译器优化 C采用两级 Cache D虚拟 Cache15、现有一个 Web 服务器,其它部分不变的情况下,若采用如下的增强方式:采用40 个 CPU,想要达到 30
7、的加速比,则串行部分的比率最大是 A 。A0.11 B0.12 C0.10 D 0.13三、简述题(每题 5 分,共 25 分)1、解释如下几个缩写:RISC、ISA、MIMD、RAID、Cache。RISC 精简指令集计算机ISA 工业标准结构MIMD 多指令流多数据流RAID 廉价磁盘冗余阵列Cache 高速缓冲存储器2、试说明名相关的两种类型。反相关:指令 i 先执行,指令 j 写的名是指令 i 读的名。反相关指令之间的执行顺序是必须保证的,反相关就是先读后写相关。输出相关:指令 j 和指令 i 写相同的名。输出相关指令的指令顺序是不允许颠倒的。输出相关就是写后写相关。3、试说明定向技术
8、的思想。定向技术的思想是:在某条指令产生一个计算结果之前,其他指令并不真正需要该计算结果,如果将该计算结果产生的地方直接送到其他指令需要他的地方,那么就可以避免暂停。4、试说明伪相联 Cache 的特点。伪相联 Cache 既能获得多路组相联 Cache 的低失效率,又能保持直接映像 Cache 的命中速度。采用这种方法时,在命中情况下,访问 Cache 的过程和直接映像 Cache中的情况相同,而发生失效时,在访问下一级存储器之前会先检查 Cache 另一个位置,看是否匹配。5、试说明分布式共享多处理机的优缺点。分布式存储器结构的优点:(1)如果大多数的访问是针对本结点的局部存储器,则可降低
9、对存储器和互连网络的带宽要求;(2)对局部存储器的访问延迟低。主要缺点:处理器之间的通信较为复杂,且各处理器之间访问延迟较大。四、图表题(第一题 6 分,第二题 9 分,共 15 分)1、 (6 分)下图是写操作流水化的硬件结构,试说明采用该技术的原因及其工作特点。每个写操作过程分为两个阶段完成,第一阶段进行标识比较,并把标识和数据存入延迟写缓冲器中,第二阶段再进行写入,这两个阶段按流水方式工作。这样,当前的写标识比较就可以和上一个写的数据写入并行起来,实现每个时钟周期完成一个写操作2、 (9 分)下面是采用 DLX 浮点部件的 Tomasulo 算法执行过程中用到的状态表,试填写状态表中的相
10、关空白。 假定:浮点流水线的延迟如下:加法 2 个时钟周期,乘法 10 个时钟周期,除法 40 个时钟周期。给出 SUBD 将要写结果时状态表的信息。只填写相关部分空格。指令状态表指令 IS EX WRLD F6,34(R2) LD F2,45(R3) MULTD FO,F2,F4 SUBD F8,F6,F2 DIVD F10,F0,F6 ADDD F6,F8,F2 保留站部件名称 Busy Op Vj Vk Qj Qk ALoad1 noLoad2 no Add1 yes SUBD Mem45+RegsR3 Mem34+RegsR2 Add2 yes ADDD Mem45+RegsR3 Ad
11、d1Add3 no Mult1 yes MULTD Mem45+RegsR3 Regs4Mult2 yes DIVD Mem34+RegsR2 Mult1结果寄存器状态表F0 F2 F4 F6 F8 F10 F30部件名称 Mult1 Add2 Add1 Mult2 五、计算题(第一题 7 分,第二题 8 分,共 15 分)1.某 RISC 处理机各类指令使用频率和理想 CPI(指令和数据访问 Cache 命中率为100时的 CPI)如下表所示。而实际测得的指令访问 Cache 缺失率(miss rate)为 5,数据访问的 Cache 缺失率为 10,Cache 的缺失损失(miss pen
12、alty)为40 个时钟周期。1)该机器在无 Cache 缺失(理想情况)时的 CPI 是多少?(3 分)2)该机器在无 Cache 缺失(理想情况)时的速度比有 Cache 缺失时快几倍?(4分)指令类型 ALU 操作 Loads Stores Branches使用频率 40 20 15 25CPI ideal 1 3 3 31)CPI=43%X1+21%X2+12%X2+24%X2=1.572)对指令讲,指令 Cache 的访问占全部访问的 100%/(100%+21%+12%)=75%对数据来讲,数据 Cache 的访问占全部访问的(21%+12%)/(100%+21%+12%)=25%
13、非理想平均访存时间命中时间失效率 X 失效开销1.57(75%X5%+25%X10%)X401.572.54.07则:4.07/1.572.592.6 大约快 2.6 倍2.在一台单流水线处理机上执行下面的程序。每条指令都要经过“取指令” 、 “译码”、 “执行”和“写结果”4 个流水段,每个流水段的执行时间都是 10ns。采用基本的 DLX 流水线,执行如下指令段:1 SUB R0, R0 ;R002 LD R1, #4 ;R1向量长度 43 LOOP: LD R2, A(R1) ;R2A 向量的一个元素4 MUL R2, R1 ;R2(R2)(R1) 5 ADD R0, R2 ;R0(R0
14、)(R2)6 BNEZ R1, LOOP ;R1(R1)1,若(R1)0 转向 LOOP7 SD (R3), R0 ;保存结果采用“预测分支失败技术” 。画出指令流水线的时空图(中间部分可以省略,图中可用指令序号表示) ,计算流水线的加速比。 (8 分) 1 IF ID EX WB2 IF ID EX WB3 IF ID EX WB4 IF ID EX WB5 IF ID EX WB6 IF ID EX WB7 IF ID idle idle3 IF ID EX WB4 IF ID EX WB5 IF ID EX WB6 IF ID EX WB7 IF ID idle idle3 IF ID EX WB4 IF ID EX WB5 IF ID EX WB6 IF ID EX WB7 IF ID idle idle3 IF ID EX WB4 IF ID EX WB5 IF ID EX WB6 IF ID EX WB7 IF ID EX WB加速比 S22X40/25X10 3.52