搜档网
当前位置:搜档网 › 广西工学院计算机系统结构习题与答案(15页,有题有答案)

广西工学院计算机系统结构习题与答案(15页,有题有答案)

广西工学院计算机系统结构习题与答案(15页,有题有答案)
广西工学院计算机系统结构习题与答案(15页,有题有答案)

广西工学院《计算机系统结构》习题及答案 1.系统结构基础知识

1.1 有一个经解释实现的计算机,可以按功能划分4级。每一级为了执行一条指令需要下一级的N条指令解释。若执行第1级的一条指令需Kns时间,则执行第2、3、4级的一条指令各需要多少时间?

【分析】注意“上一级”与“下一级”的关系,上一级程序在下一级上的实现不是经翻译完成,只能是解释。

解:执行第1级的一条指令需Kns时间

执行第2级的一条指令需KNns时间

执行第3级的一条指令需KN2ns时间

执行第4级的一条指令需KN3ns时间

执行第n级的一条指令需KN n-1ns时间

1.2 有一计算机系统,可以按功能划分4级。每一级的指令互不相同。每一级的指令都比下一级的指令在效能上强M倍,即第i 级的一条指令能完成第i-1级的M条指令的计算量。现若需第i级的N条指令解释第i+1级的一条指令,而有一段程序在第1级上运行需要Ks,问在第2、3、4级上一段等效的程序各需要运行多长时间?

【分析】从指令功能意义上讲,每级的单条指令需下级N条指令来完成,从效能意义上讲,每级的指令都比下一级的指令强M 倍,若某级上运行需Ks,则下一级上运行需KN/Ms。

解:在第2级上一段等效的程序需要运行时间为: (N/M)Ks

在第3级上一段等效的程序需要运行时间为: (N/M)2Ks

在第4级上一段等效的程序需要运行时间为: (N/M)3Ks

1.3 什么是透明性概念?对于计算机系统结构,下列哪些是透明的?哪些是不透明的?

存储器的模m交叉存取、浮点数据表示、I/O系统是采用通道方式还是外围处理机方式、数据总线宽度、字符行运算指令、阵列运算部件、通道是采用结合型还是独立型、PDP-11系列的单总线结构、访问方式保护、程序性中断、串行、重叠还是流水控制方式、堆栈指令、存储器最小编址单位、Cache存储器。

【分析】凡是属于编写机器语言和汇编语言程序所必须面对的容,都是不透明的。或者说有关系统结构属性所包括的容,对系统结构都不透明。

解:客观存在的事物或属性,从某个角度看,它好像不存在,称之为透明性。

对于计算机系统结构,透明的是:存储器的模m交叉存取、数据总线宽度、阵列运算部件、通道是采用结合型还是独立型、PDP-11系列的单总线结构、串行、重叠还是流水控制方式、Cache存储器。

对于计算机系统结构,不透明的是:浮点数据表示、I/O系统是采用通道方式还是外围处理机方式、字符行运算指令、访问方式保护、程序性中断、堆栈指令、存储器最小编址单位。

1.4 从机器(汇编)语言程序员的角度来看,以下哪些是透明的?

指令地址寄存器、指令缓冲器、时标发生器、条件码寄存器、乘法器、主存地址寄存器、磁盘外设、先行进位链、移位器、通用寄存器、中断字寄存器。

【分析】从机器(汇编)语言程序员的角度来看,实际上就是从计算机系统结构看的容。在汇编语言程序中直接用到的,肯定是不透明的。

解:对机器(汇编)语言程序员透明的:指令缓冲器、时标发生器、乘法器、主存地址寄存器、先行进位链、移位器。

对机器(汇编)语言程序员不透明的:指令地址寄存器、条件码寄存器、磁盘外设、通用寄存器、中断字寄存器。

1.5 下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?

系列机各档不同的数据宽度、虚拟存储器、Cache存储器、程序状态字、“启动I/O”指令、“执行”指令、指令缓冲存储器

【分析】系统程序员和应用程序员都有可能应用汇编语言或机器语言编程,当然也可能使用高级语言编程。所以,属全硬件实现的计算机组成所包含的方面,对他们都是透明的。

解:对系统程序员(编写系统软件的人)和应用程序员透明的:系列机各档不同的数据宽度、Cache存储器、指令缓冲存储器。

虚拟存储器、程序状态字、“启动I/O”指令对系统程序员不透明,对应用程序员透明。

“执行”指令对系统程序员、应用程序员不透明。

1.8 用一台40MHz处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下:求有效CPI、MIPS速率和程序的执行时间.

解:时钟周期

程序执行时钟周期数Tn=45000+2 ×32000+ 2 ×15000+ 2 ×8000=155000

程序执行时间Ts=(45000+2 ×32000+ 2 ×15000+ 2 ×8000) ×0.25 ×10-7 =3.875ms

IC=45000+32000+15000+8000=1 ×105

MIPS=IC/Ts ×10-6=26

CPI=Tn/IC=1.55

1.6 想在系列机中发展一种新型号机器,你认为下列哪些设想可以考虑,哪些则不行,为什么?

(1)新增加字符数据类型和若干条字符处理指令,以支持事务数据处理程序的编译。

(2)为增强中断处理功能,将中断分级由原来的4级增加到5级,并重新调整中断响应的优先次序。

(3)在CPU与主存之间增设Cache存储器,以克服访存速度过低的系统性能瓶颈。

(4)为解决计算误差较大问题,将机器中浮点数的下溢处理方法由原来的“恒置1”法,改为增设用只读存储器存放下溢处理结果的查表舍入法。

(5)为增加寻址灵活性和减少平均指令字长,将原来全部采用等长操作码的指令,改为具有3类不同码长的扩展操作码。

(6)将CPU与主存之间的数据通路宽度由16位扩展成32位,以加快主机部的数据传送。

(7)为减少使用公用总线的冲突,将单总线改为双总线。

(8)把原来的0号通用寄存器改作专用的堆栈指示器。

【分析】系列机发展新型号机器最主要的是必须保证应用软件的向后兼容。一般属于计算机组成和实现的东西的改进不会影响系统结构。

解:(1)可以。新增加数据类型和指令,不影响已有指令编写的程序的执行。

(2)不可以。重新调整中断响应的优先次序,会影响原有程序工作的正确性。

(3)可以。Cache存储器属于计算机组成。

(4)可以。浮点数尾数的下溢处理属于计算机组成。

(5)不可以。指令系统的改变,会直接导致原有程序不能正确运行。

(6)可以。数据通路宽度属于计算机组成。

(7)可以。单总线改为双总线属于计算机组成。

(8)不可以。通用寄存器的改变无疑会影响原有相关指令的运行,以致程序不能正常工作。

1.7 假设Cache工作速度为主存的5倍,且Cache被访问命中的概率为90%,则采用Cache后,能使整个存储系统获得多高的加速比?

解:∵ Se=5 Fe=0.9∴ Sn=1/(1-Fe+Fe/Se)= 3.57

1.8 用一台40MHz

求有效CPI、MIPS

解:时钟周期T=1/(40×106)=0.25 ×10-7 s

程序执行时钟周期数Tn=45000+2 ×32000+ 2 ×15000+ 2 ×8000=155000

程序执行时间Ts=(45000+2 ×32000+ 2 ×15000+ 2 ×8000) ×0.25 ×10-7 =3.875ms

IC=45000+32000+15000+8000=1 ×105

MIPS=IC/Ts ×10-6=26

CPI=Tn/IC=1.55

1.9

假设三个程序中每一个都有1MIPS速率。根据这些速率值,你能否得出有关三台计算机相对性能的明确结论?你能否找到一种将它们统计排序的方法,试说明理由。

解:

平均性能:因为C A B

总的执行时间:一致的衡量标准

就此题来说,用总的执行时间或平均MIPS较好

性能排序: C A B

2. 数据表示与指令

2.1 数据结构和机器的数据表示之间是什么关系?确定和引入数据表示的基本原则是什么?

解:数据表示是数据结构的组成元素,数据结构要通过软件映像变换成机器所具有的各种数据表示来实现。不同的数据表示可为数据结构的实现提供不同的支持,表现在实现效率和方便性上不同。数据结构和数据表示是软件和硬件之间的交界面。

确定和引入数据表示的基本原则:一是看系统效率是否提高,即是否减少了实现的时间和存储的空间,实现时间是否减少又主要看在主存和处理机之间传送的信息量有否减少;二是看引入这种数据表示的通用性和利用率是否较高。

2.2 标志符数据表示和描述符数据表示有何区别?描述符数据表示与向量数据表示对向量数据结构所提供的支持有什么不同?解:在标志符数据表示中,标志符是与每个数据相连的,并且合存在同一个存储单元中,用于描述单个数据的类型等属性;在描述符数据表示中,数据描述符是与数据分开独立存放的,主要是用于描述成块数据的类型属性、地址及其它信息的。

描述符数据表示在实现向量、阵列数据元素的索引上要比用变址方法的方便,能更快地形成元素的地址,从而可以迅速进行访问,同时,也有利于检查程序中的向量、数组在使用中是否越界。因此,它为向量、数组数据结构的实现提供了一定的支持,有利于简化编译中的代码生成。

但是,描述符数据表示并没有向量、数组的运算类指令,也没有采用流水或处理单元阵列形式的高速运算硬件,没有对阵列中每个元素又是一个子阵列的相关性交叉阵列进行处理的硬件,也没有对稀疏向量和数组进行压缩存储、还原、运算等指令和硬件。因此,它对向量和数组的数据结构提供的支持不够强,所以并不是向量数据表示。

2.3 经统计,某机14条指令的使用频率分别是:0.01,0.15,0.12,0.03,0.02, 0.04,0.02,0.04,0.01,0.13,0.15,0.14,0.11,0.03。分别求出用等长二进制编码、Huffman编码、只有两种码长的扩展操作码编码等3种方式的操作码平均码长。

解:(1)14条指令的等长操作码的平均码长是对log214上取整,即4位。

(2)本题的Huffman树如下图:

= 3.38

0.13、0.12、0.11的6

4条共计8条使用平均代码长度为(0.15+0.15+0.14+0.13+0.12+0.11)×3 + (1-0.80)×5 = 3.4位

2.4 某机指令字长16位。设有单地址指令和双地址指令两类。若每个地址字段都是6位,且双地址指令有x 条。问单地址指令最多可以有多少条?

解:根据题意,双地址指令格式为:

其操作码占了4位,这样,共有24=16种短操作码。现双地址指令有X 条,已占用了4位操作码中16种组合中的X 个码点,所以剩下(16-X )个码点均可用作扩展标志。

单地址指令的格式为

16-X )*26条。

2.5 某模型机有9条指令,其使用概率为:

ADD (加):30%;CLA (清加):20%;JOM (按负转移):6%;SHR (右移):2%;STO (存):7%;

SUB (减):24%;JMP (转移): 7%;CIL (循环左移):3%; STP (停机):1%。

要求有两种指令字长,都按双操作数指令编排。采用扩展操作码,并限制只能有两种操作码码长。设该机有若干个通用寄存器。主存为16位宽,按字节编址,采用按整数边界存储,任何指令都在一个主存周期中取得。短指令为寄存器—寄存器型,长指令为寄存器—主存型,主存地址应能变址寻址。

(1)仅根据使用频度,不考虑其它要求,设计出全Huffman 操作码,并计算其平均码长;

(2)考虑题目全部要求,设计优化实用的操作码形式,并计算其操作码的平均码长;

(3)该机允许使用多少个可编址的通用寄存器?

(4)画出该机两种指令字格式,标出各字段之位数;

(5)指出访存操作数地址寻址的最大相对位移量为多少个字节。

解:(1)本题的Huffman 树如下图:

位 JOM 6% 11000

STO 7% 11001

JMP 7% 11010

SHR 2% 11011

CIL 3% 11100

STP 1% 11101

操作码的平均码长为:

2×(0.3+0.24+0.2)+5×(0.06+0.07+0.07+0.02+0.03+0.01)= 2.78位

(3)该机允许使用的可编址的通用寄存器个数为23=8个

(4)短指令(1字节)格式为

长指令(2字节)格式为

2.6 下面一段程序的功能是在主存A 、B 、C 三个单元中找出最大的一个数送入主存MAX

单元中,在某RISC 处理机中,每条指令的执行过程分为“取指令”和“执行指令”两个阶段,并采用两级流水线。 START: LOAD R1, A ; (A) ->R1 LOAD R2, B ; (B) ->R2

LOAD R3, C ; (C) ->R3

CMP R1, R2

BGE NEXT1 ; 若R1>R2转NEXT1

MOVE R2, R1 ; R2->R1

NEXT1: CMP R1, R3

BGE NEXT2 ; 若R1>R3转NEXT2

MOVE R3, R1 ; R3->R1

NEXT2: STORE R1, MAX ; 存结果

(1)如果在处理机中采用指令取消技术,问上述程序的执行结果是否正确?从中得到什么启示?

(2)如果在处理机中采用延时转移技术,对上述指令序列进行适当的调整,在确保程序语义正确的前提下,尽可能缩短程序的执行时间。

解:采用指令取消技术,程序执行结果正确,但在转移成功时,要取消下一条指令,相当于多执行了2条指令,假如两次都转移成功的话。

START: LOAD R1, A

LOAD R2, B

LOAD R3, C

CMP R1, R2

BGE NEXT1 ; 转移成功时,要取消下一条指令

MOVE R2, R1

NEXT1: CMP R1, R3

BGE NEXT2 ; 转移成功时,要取消下一条指令

MOVE R3, R1

NEXT2: STORE R1, MAX

(2)程序适当调整如下:

START: LOAD R1, A

LOAD R2, B

CMP R1, R2

BGE NEXT1

LOAD R3, C

MOVE R2, R1

NEXT1: CMP R1, R3

BGE NEXT2

NOP

MOVE R3, R1

NEXT2: STORE R1, MAX

主存逻辑地址

2.7 下面是一个数据块搬家程序。在RISC处理机中,为了提高指令流水线的执行效率,通常要采用指令取消技术。

START: MOVE AS, R1 ; 源数组首地址送变址寄存器R1

MOVE NUM, R2 ; 数据个数送R2

LOOP: MOVE (R1), AD-AS(R1) ; AD-AS为地址偏移量

INC R1 ; R1增1

DEC R2 ; R2计数减1

BGT LOOP ; 数据未送完,继续

HALT ; 停机

NUM: N ; 需要传送的数据总数

(1)如果一条指令的执行过程分解为“取指令”和“分析指令”两个阶段,并采用两级流水线。为了采用指令取消技术,编译程序如何修改上面的程序。

(2)如果N=100,采用指令取消技术后,在程序执行过程中,能节省多少个指令周期?

(3)如果一条指令的执行过程分解为“取指令”、“分析指令”和“执行指令”三个阶段,并采用三级流水线。为了采用指令取消技术,编译程序如何修改上面的程序。

解:(1)修改程序为

START: MOVE AS, R1

MOVE NUM, R2

MOVE (R1), AD-AS(R1)

LOOP: INC R1

DEC R2

BGT LOOP

MOVE (R1), AD-AS(R1)

HALT

NUM: N

(2)能节省99个指令周期。

(3)修改程序为

START: MOVE AS, R1

MOVE NUM, R2

MOVE (R1), AD-AS(R1)

INC R1

LOOP: DEC R2

BGT LOOP

MOVE (R1), AD-AS(R1)

INC R1

HALT

NUM: N

注:转移不成功,取消后两条指令

2.8 简要比较CISC机器和RISC机器各自的结构特点,它们分别存在哪些不足和问题?为什么说今后的发展应是CISC和RISC 的结合?

解:1.CISC的特点:(1)指令格式不固定,指令可长可短,操作数可多可少;

(2)寻址方式复杂多样,操作数可来自寄存器,也可来自存储器;

(3)采用微程序控制,执行每条指令均需完成一个微指令序列;

(4)CPI > 5,指令越复杂,CPI越大

2.RISC的特点(1)大多数指令在单周期完成(2)采用LOAD/STORE结构(3)硬布线控制逻辑

(4)减少指令和寻址方式的种类(5)固定的指令格式(6)注重译码的优化3.CISC存在的问题:(1)未考虑20%与80%规律

(2) CISC控制十分复杂,不规整,不符合VLSI发展的方向

(3)在CISC中,虽然增加了硬件指令,但并不能保证整个程序执行时间的缩短。因为这些复杂指令要消耗较多的CPU周期数,但又不常用。

4.RISC的不足(1)加重汇编语言程序设计的负担(2)目标程序所占的存储空间可能加大

(3)对浮点运算和虚拟存储器的支持还不够强(4)对编译程序的质量要求较高,难度较大5.今后计算机发展改进的总趋势是让RISC和CISC互相结合,取长补短。

计算机系统结构题库

《计算机系统结构》题库 一.单项选择题(在下列每小题的四个备选答案中,只有一个答案是正确的,请把你认为是正确的答案填入题后的()内,每小题2分) 第一章: 1.计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是: A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级机器语言机器级---汇编语言机器级 D.汇编语言机器级---应用语言机器级---高级语言机器级 答案:B 分数:2 所属章节1—1 2.汇编语言源程序变成机器语言目标程序是经来实现的。 A. 编译程序解释 B. 汇编程序解释 C. 编译程序翻译 D. 汇编程序翻译 答案:D 分数:2 所属章节1—1 3.直接执行微指令的是: A. 汇编程序 B. 编译程序 C. 硬件 D. 微指令程序 答案:C 分数:2 所属章节1—1 4.对系统程序员不透明的是: A. Cache存储器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存储器 答案:D 分数:2 所属章节1—2 5.对应用程序员不透明的是: A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器 答案:D 分数:2 所属章节1—2 6.对机器语言程序员透明的是: A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码 答案:B 分数:2 所属章节1—2 7.计算机系统结构不包括: A. 主存速度 B. 机器工作状态 C. 信息保护 D. 数据表示 答案:A 分数:2 所属章节1—2 8.对计算机系统结构透明的是: A. 字符行运算指令 B. 是否使用通道行I/O处理机 C. 虚拟存储器 D. VLSI技术 答案:D 分数:2 所属章节1—2 9.对汇编语言程序员透明的是: A.I/O方式中的DMA访问方式 B. 浮点数据表示 C. 访问方式保护 D 程序性中断. 答案:A 分数:2 所属章节1—2 10.属计算机系统结构考虑的应是:

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的 通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。 ·实验原理: 指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤 一.使用WinDLX模拟器,对做如下分析: (1)观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。 (2)考察增加浮点运算部件对性能的影响。 (3)考察增加forward部件对性能的影响。 (4)观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程 一.使用WinDLX模拟器,对做如下分析: } 浮点加、乘、除部件都设置为1,浮点数运算部件的延时都设置为4,如图1: 图1 初始设置 将和加载至WinDLX中,如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组合。 1)数据相关 点击F7,使程序单步执行,当出现R-Stall时停止,运行过程中出现下图3所示,输入整数6。 图3 输入整数6 @ 打开Clock Diagram,可以清楚的看到指令执行的流水线如图4所示。 图4 指令流水线 双击第一次出现R-Stall的指令行,如图5所示。

图5 指令详细信息 对以上出现的情况分析如下: 程序发生了数据相关,R-Stall(R-暂停)表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据;而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。 上述过程发生了WR冲突,即写读相关。为了避免此类冲突, seq r5,r4,0×a的intEX指令延迟了一个周期进行。 由此,相关指令为: 2)控制相关 由图6可以看出,在第4时钟周期:第一条指令处于MEM段,第二条命令处于intEX段,第三条指令出于aborted状态,第四条命令处于IF段。 图 6 指令流水线 }

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示: (1 用两给出条指 (1) (24? 变八级流水线(细分) ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。

(2) (3)重复设置部件 吞吐率提高倍数= t t ??2310 75 =1.64 3.5 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 +B 4;再计算由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。 段23 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

2010年4月自考计算机系统结构试题及答案

全国2010年4月自学考试计算机系统结构试题 课程代码:02325 一、单项选择题(本大题共10小题,每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1.在计算机系统结构设计中,提高软件功能实现的比例可( ) A.提高解题速度B.减少需要的存储器容量 C.提高系统的灵活性D.提高系统的性能价格比 2.浮点数表示的尾数的基r m=16,尾数长度p=8,可表示的规格化最大正尾数的值是( ) A.1/256 B.1/2 C.15/16 D.255/256 3.下列数据存储空间为隐含寻址方式的是( ) A.CPU中的通用寄存器B.主存储器 C.I/O接口中的寄存器D.堆栈 4.当计算机系统执行通道程序完成输入输出工作时,执行通道程序的是( ) A.CPU B.通道 C.CPU和通道D.指定的外设 5.下列有关中断的叙述正确的是( ) A.中断响应的次序是由硬件决定的B.中断处理的次序是由硬件决定的 C.中断处理的次序是不可改的D.中断响应的次序是可灵活改变的 6.与虚拟存储器的等效访问速度无关 ..的是( ) A.访存页地址流B.页面替换算法 C.主存的容量D.辅存的容量 7.非线性流水线的特征是( ) A.一次运算中使用流水线中的多个功能段 B.一次运算中多次使用流水线中的某些功能段 C.流水线中某些功能段在各次运算中的作用不同 D.流水线的各功能段在不同的运算中可以有不同的连接 8.属于集中式共享存储器结构的SIMD计算机是( ) A.ILLIAC IV B.BSP C.CM-2 D.MP-1 1

计算机体系结构实验报告二

实验二结构相关 一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。 二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行 周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。 三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程 打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

计算机系统结构有详细答案

(仅供参考,不作为考试标准), 选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员 。意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速 。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同 栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法 象联组,相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高 是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路 令指条下析分后推C) 令指条下行执后推D) 流的用采,时关据数到,中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

(完整版)计算机系统结构试题及答案

计算机系统结构复习题 单选及填空: 计算机系统设计的主要方法 1、由上往下的设计(top-down) 2、由下往上的设计(bottom-up) 3、从中间开始(middle-out) Flynn分类法把计算机系统的结构分为以下四类: (1)单指令流单数据流 (2)单指令流多数据流 (3)多指令流单数据流 (4) 多指令流多数据流 堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。 名词解释: 虚拟机:用软件实现的机器叫做虚拟机,但虚拟机不一定完全由软件实现,有些操作可以由硬件或固件(固件是指具有软件功能的固件)实现。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 兼容机:它是指由不同公司厂家生产的具有相同系统结构的计算机。 流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。 单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。 多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。 吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。 指令的动态调度:

是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。 指令的静态调度: 是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。 超标量: 一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。 超流水:在一个时钟周期内分时流出多条指令。 多级存储层次: 采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的内容都是其下一层(离CPU更远的一层)存储器中内容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。 写直达法: 在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。写回法: 只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。 集中式共享多处理机: 也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成,各处理器共享一个集中式的物理存储器,这个主存相对于各处理器的关系是对称的, 分布式共享多处理机: 它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址,在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。 多Cache一致性: 多处理机中,当共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储器块的副本,要保证多个副本数据是一致的。 写作废协议: 在处理器对某个数据项进行写入之前,它拥有对该数据项的唯一的访问权 。 写更新协议: 当一个处理器对某数据项进行写入时,它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。 机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机体系结构试题汇总

计算机系统结构 姓名:学号: 一、简答题(每小题10分,共20分) 1.简述使用物理地址进行DMA存在的问题,及其解决办法。 2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。 二、(60分)现有如下表达式: Y=a ×X 其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。 1.请写出实现该表达式的MIPS代码。 2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。 3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。 4.根据3的结果说明流水线相关对CPU性能的影响。 三、(20分)请分析I/O对于性能的影响有多大?假设: 1.I/O操作按照页面方式进行,每页大小为16 KB,Cache块大小为64 B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。 2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。 3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机系统结构复习总结

计算机系统结构复习总结

计算机系统结构复习总结 一、计算机系统结构概念 1.1 计算机系统结构:程序员所看到的计算机的基本属性,即概念性结构与功能特性。 *注意:对不同层次上的程序员来说,由于使用的程序设计语言不同,可能看到的概念性结构和功能特性会有所不同。 1.2 计算机系统的层次结构 现代计算机是一种包括机器硬件、指令系统、系统软件、应用程序和用户接口的集成系统。 现代计算机结构图 *注意:计算机结构的层次模型 依据计算机语言广义的理解,可将计算机系统看成由多级“虚拟”计算机所组成。

从语言层次上画分可得下图: 计算机结构的层次模型 1.3计算机系统结构组成与实现 计算机系统结构:是计算机系统的软件与硬件直接的界面 计算机组成:是指计算机系统结构的逻辑实现 计算机实现:是指计算机组成的物理实现*计算机系统结构、组成与实现三者间的关系: 计算机系统结构不同会影响到可用的计算机组成技术不同,而不同的计算机组成又会反过来影响到系统结构的设计。因此,计算机系统结构的设计必须结合应用来考虑,要为软件和算法的实现提供更多更好的硬件支持,同时要考虑可

能采用和准备采用哪些计算机组成技术,不能过多或不合理地限制各种计算机组成、实现技术的采用与发展。 计算机组成与计算机实现可以折衷,它主要取决于器件的来源、厂家的技术特长和性能价格比能否优化。应当在当时的器件技术条件下,使价格不增或只增很少的情况下尽可能提高系统的性能。 1.4 计算机系统结构的分类 计算机结构分类方式主要有三种: (1)按“流”分类 按“流”分类法是Flynn教授在1966年提出的一种分类方法,它是按照计算机中 指令流(Instruction Stream)和数据流(Data Stream)的多倍性进行分类。指令流是指机 器执行的指令序列,数据流是指指令流调用 的数据序列。多倍性是指在计算机中最受限 制(瓶颈最严重)的部件上,在同一时间单 位中,最多可并行执行的指令条数或处理的 数据个数。 *注意:按“流”分类法,即Flynn分类法的逻

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

计算机系统结构_小抄

1.Cache一致性问题主要由哪些可能的因素有关? 共享可写数据引起的不一致,进程迁移引起的不一致,I/O 传输引起的不一致 2.在先行控制方式处理机中,为了保证处理机的最大性能,对于控制相关(包括短循环)采取了哪些应对措施? 采用硬件或软件的办法尽量避免数据相关发生; 在确保指令正确执行的前提下,推后指令分析; 设置相关专用通路来解决数据梯状 3.数据类型、数据表示和数据结构之间的关系是什么?在设计一个计算机系统时,确定数据表示的原则主要有哪几个? 数据表示研究的是计算机硬件能够直接识别,可以被指令系统直接调用的那些数据类型。数据结构研究的是面向系统软件,面向就用领域所需要处理的各种数据类型,研究这些数据类型的逻辑结构和物理结构之间的关系,并给出相应的算法。 数据表示和数据结构都是数据类型的子集。原则:一是缩短程序的运行时间,二是减少CPU与主存储器之间的通信量,三是这种数据表示的通用性和利用率。 4.从机器(汇编)语言程序员看,以下哪些是透明的?指令地址寄存器;指令缓冲器;时标发生器;条件码寄存器; 乘法器;主存地址寄存器;磁盘外设;先行进位链;移位器;通用寄存器;中断字寄存器; 参考答案:透明的有:指令缓冲器、时标发生器、乘法器、先行进位链、移位器 5.用具体例子来说明计算机系统结构、计算机组成和计算机实现三个概念 计算机系统结构、计算机组成和计算机实现是三个不同的概念。系统结构是计算机系统的软、硬件的界面; 计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。 6.综述线性流水线和非线性流水线的异同? 线性流水线段间无反馈或越过的通路,非线性流水线则有反馈回路或前越通路。 在线性流水线中,由于每一个任务在流水线的每一功能段中都流过一次,而且仅流过一次,因此,可以在每一个时钟周期向流水线输入一个新任务。 在非线性流水中,由于存在有反馈回路,当一个任务在流水线中流过时,在同一个功能段中可能要经过多次。因此,就不能每一个时钟周期向流水线输入一个新任务。线性流水线是将流水线的各段逐个串接起来。非线性流水线经常用于递归调用,或构成多功能流水线。其性能指标有吞吐率、加速比和效率。 7.虚拟机:通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。 8.程序访问的局部性 局部性的实质是:根据程序的最近情况,可以较精确地预测出最近的将来将要用到哪些指令和数据。 9、分别用变址寻址方式和间接寻址方式编写一个程序,求C=A+B,其中,A与B都是由n个元素组成的一维数组。比较两个程序,并回答下列问题: (1)从程序的复杂程度看,哪一种寻址方式更好? (2)从硬件实现的代价看,哪一种寻址方式比较容易实现? (3)从对向量运算的支持看,哪一种寻址方式更好? 参考答案:(1)变址寻址方式(2)间接寻址方式(3)变址寻址方式 10、简述SIMD计算机的分布式存储器与共享存储器的异同。 参考答案:SIMD计算机的分布式存储器与共享存储器的相同点都存在互联网络。 不同点是在共享内存方案中,共享的多体并行存储器通过对准网络与各处理单元相连。在分布内存方案中,每个处理单元有自己的本地存储器,处理单元有自己的本地存储器,处理单元之间的数据通过数据寻径网络完成。 11、根据多台外围设备共享通道的不同情况,通道可分为那三种类型? 参考答案:字节多路通道、选择通道、数组多路通道。 12、简述流水线技术的特点 参考答案:流水线技术具有以下特点: ⑴水过程由多个相联系的子过程组成,每个过程称为流水线的"级"或"段"。

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学 实验报告 课程名称计算机系统结构 计算机学院03班 王陈(11)

目录 实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。 相关性分析结果........................................................................... 错误!未定义书签。 增加浮点运算部件对性能的影响........................................... 错误!未定义书签。 增加forward部件对性能的影响 ............................................ 错误!未定义书签。 转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

-计算机系统结构(有详细答案)

(仅供参考,不作为考试标准), 选择题(30分,每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员 在计算机系统设计时,为了提高系统性能,应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度 重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度 为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法 与全相联映象相比,组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令 流水操作中,遇到数据相关时,采用的解决办法有________。 A)用优化编译器检测,通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络 虫蚀寻径以流水方式在各寻径器是顺序传送的是________。 授课:XXX

计算机系统结构期末考试试题及其答案

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页 共 24 页 计算机科学系《计算机系统结构》期末考试试卷(A 卷) 2、此试卷适用于计算机科学与技术本科专业。 一 单选题:(10分,每题1分) 1、 ."启动I/O"指令是主要的输入输出指 令,是属于( B ) A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对(B )是透 明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定,组内任何虚页可装入任何实页位

置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写 后读的数据相关,则(B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是(B) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是 (C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

计算机系统结构实验报告

计算机系统结构实验报告 一.流水线中的相关 实验目的: 1. 熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: WinDLX模拟器 实验内容和步骤: 1.用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序 用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准 输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。 实验结果: 在载入fact.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,我们得到的结果

计算机系统结构考试计算题

有一指令流水线如下所示 入 1 2 3 4 出 50ns 50ns 100ns 200ns (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段请采取两种不同的措施消除此“瓶颈”。对 于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少 解:(1) 2200(ns) 2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1T n TP 1pipeline -== 45.45%11 5 4400TP m t TP E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 变成八级流水线(细分) 850(ns) 509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n TP 1pipeline -== 58.82%17 10 8400TP m ti TP E m 1 i ≈=? =?? =∑= 重复设置部件 1 2 3_1 3_2 4_1 4_4 入 出

)(ns 851T n TP 1pipeline -== 58.82%17 10 8 85010400E ≈=??= 有一 4段组成,其3段时,总次,然后流到第4段。如果 需要的时间都是t ?,问: (1) 当在流水线的输入端连续地每t ?时间输入任务时,该流水线会发生 什么情况 (2) 此流水线的最大吞吐率为多少如果每t ?2输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少 (3) 当每段时间不变时,如何提高该流水线的吞吐率仍连续处理10个任 务时,其吞吐率提高多少 (2)

相关主题