搜档网
当前位置:搜档网 › 计算机系统结构模拟题

计算机系统结构模拟题

计算机系统结构模拟题
计算机系统结构模拟题

《计算机系统结构》模拟题(补)一.单项选择题

1. SIMD是指()。

A、单指令流单数据流

B、单指令流多数据流

C、多指令流单数据流

D、多指令流多数据流

2. 磁盘外部设备适合于连接到()。

A.字节多路通道B.数组多路通道或选择通道

C.选择通道或字节多路通道D.数组多路通道或字节多路通道

3. 下列()存储设备不需要编址。

A. 通用寄存器

B. 主存储器

C. 输入输出设备

D. 堆栈

4.多处理机的各自独立型操作系统( )。

A.要求管理程序不必是可再入的

B.适合于紧耦合多处理机

C.工作负荷较平衡

D.有较高的可靠性

5.输入输出系统硬件的功能对( )是透明的。

A.操作系统程序员

B.应用程序员

C.系统结构设计人员

D.机器语言程序设计员

6. 实现汇编语言源程序变换成机器语言目标程序是由()。

A.编译程序解释B.编译程序翻译

C.汇编程序解释D.汇编程序翻译

7.全相联地址映象是指( )。

A.任何虚页都可装入主存中任何实页的位置

B.一个虚页只装进固定的主存实页位置

C.组之间是固定的,而组内任何虚页可以装入任何实页位置

D.组间可任意装入,组内是固定装入

8.( )属于MIMD系统结构。

A.各处理单元同时受同一个控制单元的管理

B.各处理单元同时接受同一个控制单元送来的指令

C.松耦合多处理机和多计算机

D.阵列处理机

9.设16个处理器编号分别为0,1,2,…,15用Cube3互联函数时,第10号处理机与第( )

号处理机相联。

10.若输入流水线的指令既无局部性相关,也不存在全局性相关,则( )。

A.可获得高的吞吐率和效率

B.流水线的效率和吞吐率恶化

C.出现瓶颈

D.可靠性提高

11.流水线的技术指标不包括( )。

A.响应比

B.吞吐率

C.加速比

D.效率

12.指令优化编码方法,就编码的效率来讲,方法最好是()。

A. 固定长度编码

B. 扩展编码法

C. Huffman编码法

D. 以上编码都不是

13.RISC 计算机的指令系统集类型是 ( ) 。

A. 堆栈型

B. 累加器型

C. 寄存器—寄存器型

D. 寄存器 - 存储器型

14.相联存储器的访问方式是( )。

A.先进先出顺序访问B.按地址访问

C.无地址访问D.按内容访问

15.存储器读写速率越高,每位的成本也越高,存储容量也小。解决这一问题的主要方法是采用( )。

A.多级存储体系结构B.并行存储器

C. Cache D.缓冲技术

16.计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是()。

A.汇编语言机器级---操作系统机器级---高级语言机器级

B.微程序机器级---传统机器语言机器级---汇编语言机器级

C.传统机器语言机器级---高级语言机器级---汇编语言机器级

D. 汇编语言机器级---应用语言机器级---高级语言机器级

17.对系统程序员不透明的是()。

存储器 B.系列几各档不同的数据通路宽度

C.指令缓冲寄存器

D.虚拟存储器

18.在计算机系统设计中,比较好的方法是()。

A.从上向下设计

B.从下向上设计

C.从两头向中间设计

D.从中间开始向上、向下设计19.不同系列的机器之间,实现软件移植的途径不包括()。

A.用统一的高级语言

B.用统一的汇编语言

C.模拟

D.仿真

20.堆栈型机器比通用寄存器型机器优越的是()。

A.支持先进先出类接替算法的求解

B.能更好地支持向量的运算

C.支持由逆波兰表达式将高级语言多元赋值语句直接编译生成堆栈指令程序

D.能优化存储器的空间利用率

21.下列说法正确的是()。

容量一般不大,命中率不会很高

芯片速度一般比CPU的速度慢数十倍

本身速度很快,但地址变换速度很慢

存储器查映象表和访问物理Cache其间可以流水,使速度与CPU匹配。22.在尾数下溢处理方法中,平均误差最大的是()。

A.截断法

B.舍入法

C.恒置“1”法查表法

23. ILLIAC Ⅳ是一种()。

A.流水线处理机

B.指令重叠处理机

C.阵列处理机

D.多处理机

24.能实现作业、任务级并行的异构型多处理机属()。

25.非线性流水线是指()。

A.一次运算中使用流水线中多个功能段

B.一次运算中要多次使用流水线中的某些功能段

C. 流水线中的某些功能段在各次运算中的作用不同

D. 流水线中的各个功能段在各种运算中有不同的组合

26.流水机器对全局性的相关处理不包括()。

A.猜测法

B.提前形成条件码

C.加快短循环程序的执行

D.设置相关专用通路

27.外部设备打印机适合于连接()。

A.数组多路通道或选择通道

B.字节多路通道或选择通道

C.选择通道

D.任意一种通道

28.虚拟存储器常用的地址映像方式是()。

A.全相联

B.段相联

C.组相联

D.直接

29.下列关于虚拟存储器的说法,比较正确的是()。

A.访主存命中率随页面大小增大而提高

B.访主存命中率随贮存容量增加而提高

C.更换替换算法能提高命中率

D.在主存命中率低时,改用堆栈型替换算法,并增大主存容量,可提高命中率30.Cache存储器常用的地址映像方式是()。

A.全相联映象

B.页表法映象

C.组相联映象

D.段页表映象

二.判断题

是指每条指令执行的平均时钟周期数。()

2.并行性是指计算机系统在同一时刻进行多种运算或操作。()

3.SIMD是多指令流多数据流。()

4.每条指令的功能应尽可能简单,并在一个机器周期内完成是RISC指令集结构的设计原则之一。()

5.线性流水线是指各段串行连接、没有反馈回路的流水线。()

6.在存贮体系中,地址映象与地址变换实际上是一回事。()

7.虚拟存贮器内部地址映象方式的选择依据于是否有高的主存命中率。()

8. 向后兼容是系列机的根本特征。()

9.对概率不等的事件用Huffman编码,其具体编码不唯一,但平均码长肯定是唯一的,且是最短的。()

10.I/O系统所带外设种类数量多,速度差异大,适宜采用专用总线来作I/O总线。()11.对标量数据来说,并行主存系统的实际频宽采用多体单字方式的要比采用单体单字方式组成的高。()

12.Cache组相联映象的块冲突概率比直接映象的高。()

13.指令的重叠解释,即可加快程序的解释,又能加快指令的解释。()

14.为了使阵列机在包括向量、数组、标量等各种题目上有尽可能高的速度性能,只需要在价格允许的情况下,尽可能增大处理单元数N即可。()

三.填空题

1.程序访问的局部性原理,包括时间局部性和局部性。

2.指令的操作码优化编码方法有_________和扩展编码。

的中文含义:。

4.流水线的效率是指流水线的利用率。

存储器系统是由Cache和__________构成的二级存储系统。

6.解释一条机器指令的微操作可归并成取指令、分析和三个部分。

7.程序员编程用的地址是__________。

8. 实现程序移植的主要途径有统一高级语言、系列机、模拟与___________。

9. 计算机系统弗林分类法,把计算机系统分成单指令流单数据流(SISD)、单指令流多数据

流(SIMD)、___________和多指令流单数据流四大类。

10. 吞吐率是流水线在内所完成的任务数或输出结果的数量。

11. 在Cache存贮器中,CPU每次写Cache的同时,也写入主存,称这种更新主存块内容的方法为法。

12.虚拟存储器主要是为解决主存_____________满足不了要求发展出来的。

13.Cache 主要是解决主存_____________满足不了要求发展出来的。

14. 并行性包括同时性和性二重含义。

四.名词解释

1.计算机系统结构

2.地址映象

3.虚拟存储系统

4.互连函数

5.Amdahl定律

6.中断输入输出方式

7.Cache存储系统

8.页式虚拟存储器

五.简答题

1.计算机系统按功能可划分成哪几级层次?

2.提高计算机系统的并行性的措施有哪些?

3.页式虚拟存储器的主要有哪些优点和缺点?

4.什么是流水线的速度瓶颈?消除这种瓶颈的方法有哪两种?

5.流水线的有哪些分类?

6.RISC有哪些特点?

六.综合题

1.有一指令流水线如下所示

50ns 50ns 100ns 200ns

(1)求连续输入10条指令,该流水线的实际吞吐率和效率;

(2)该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少?

2.报文由A~K字符组成,其出现频度依次为, , ,, , , , , , , 。

(1)各字符用等长二进制编码,传送200个字符时,需传送多少个二进制码位?

(2)构造哈夫曼树,写出各字符的二进制码位数。

(3)按哈夫曼编码,计算字符的平均码长。

(4)用哈夫曼码传送1000个字符,比定长码传送可减少传送的码位数是多少?

(5)设计一种平均码长最短的仅有两种码长的扩展操作码编码,并求出其平均

码长。

参考答案:

一.单项选择题

二.判断题

三.填空题

1.空间

2.哈夫曼编码

3.每秒百万条指令数

4.设备

5.主存

6.执行

7.逻辑地址8.仿真 9.多指令流多数据流 10.单位时间 11.写直达 12.容量

13.速度 14.并发

四. 名词解释

1.计算机体系结构:是程序员所看到的计算机的属性,即概念性结构与功能特性。这实际上是指计算机系统的外特性。

2.地址映象:把虚拟地址空间映象到主存地址空间,具体地说,就是把用户用虚拟地址编写的程序按照某种规则装入到主存储器中,并建立多用户虚地址与主存实地址之间的对应关系。

3.虚拟存储系统:虚拟存储系统由主存储器与联机的外部存储器构成,采用硬件与软件相结合的方法来调度。由于虚拟存储系统需要通过操作系统的存储管理系统来调度,因此,对系统程序员来说它是不透明的,但对于在操作系统之上编程的应用程序员来说是透明的。虚拟存储系统的访问速度与主存储器很接近,存储容量是一个很大的虚拟地址空间。

4.互连函数:为了反映不同互连网络的连接特性,每种互连网络可用一组互连函数来描述。5.Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

6.中断输入输出方式:当出现来自系统外部,机器内部,甚至处理机本身的任何例外的,或者虽然是事先安排的,但出现在现行程序的什么地方是事先不知道的事件时,CPU暂停执行现行程序,转去处理这些事件,等处理完成后再返回来继续执行原先的程序。

7.Cache存储系统:由Cache和存储器组成的系统,速度接近Cache,容量接近存储器,每单位的价格跟存储器相近,这个存储系统全部用硬件来调度,因此,它不仅对应用程序员是透明的,而且对系统程序员也是透明的。

8.页式虚拟存储器把虚拟地址空间和主存地址空间划分成同样大小的页,程序调入、调出主存以页为单位。目前一般计算机系统中,一页的大小通常为1KB至16KB。

五.简答题

1.答:第0级为硬联逻辑,是实现微指令本身的控制时序。第1级为微程序控制,是对机器指令进行译码,对应一个微指令序列,给出微指令信号。第2级为机器语言机器。这一级

的机器语言就是该机的指令系统。第3级为操作系统机器,为用户提高一个操作系统,提高了计算机系统的功能和资源利用率。第4级是汇编语言机器。这一级的机器语言是汇编语言。第5级是高级语言机器。这级的机器语言就是各种高级语言。第6级是应用语言机器。这级的机器语言是应用语言。

2.答:(1)资源重复:空间上引入并行性概念,即重复设置硬件资源以提高计算机系统的性能。(2)时间重叠:时间上引入并行性概念,即多个处理过程在时间上相互错开,轮流重叠使用同一套硬件的各个部件。(3)资源共享:利用软件方法,使多个用户分时使用同一个计算机系统。

3.答:优点:(1)主存储器的利用率比较高。(2)页表相对比较简单。(3)地址映象和变换的速度比较快。(4)对辅存(磁盘存储器)的管理比较容易。

页式虚拟存储器的主要缺点有两个:(1)程序的模块化性能不好。(2)页表很长,需要占用很大的存储空间。

4.答:一个由若干段组成的流水线,在达到稳定状态后所获得的吞吐率与其中延迟最大的那一段长度有关,这一段就成为影响流水线速度的瓶颈。

消除流水线速度瓶颈的方法主要有两种:(1)尽量采取将瓶颈子过程再细分,使之接近于流水线其他段的工作速度。(2)将多个瓶颈子过程并联。

5.答:按流水技术用于系统的等级不同,分为部件级、处理机级、系统级3个级别。

按流水线具有功能的多少,分为单功能和多功能2类。单功能流水线指流水线内各段固定连接,只完成单一的一种功能。多功能流水线指流水线中各段可以有多种不同连接,实现多种不同功能。在多功能流水线的基础上,又分为静态和动态流水线。静态流水线指在流水线内各段于同一时间里只能按其中的一种功能流水。动态流水线的各段可以同时为不同功能服务。

按流水线功能段之间有无反馈或越过,将其分为线性和非线性2类。线性流水线中的各段之间串行连接无反馈和跳越,每个任务流经各段仅一次;反之,为非线性流水线。

按流水处理机是否具有向量数据表示,分为向量流水机和标量流水机2类。

6.答:(1)指令系统中的大多数指令只执行一个简单的和基本的功能,这些指令可以比较快地在单个周期内执行完成,并减少指令的译码和解释所需要的开销。

(2)采用LOAD/STORE结构。由于访问存储器指令需要的时间比较长,因此,在指令系统中要尽量减少这类指令,只保留不可再少的LOAD和STORE两种访问存储器的指令。

(3)硬布线控制逻辑。硬布线控制逻辑可以使大多数指令在单周期内执行完成,减少了微程序技术中的指令解释开销。

(4)减少指令和寻址方式的种类。这一特点也可以简化控制部件的结构,加快指令的执行速度。

(5)固定的指令格式。该特点可以使指令的译码逻辑电路简化,从而也使控制部件的速度加快。

(6)注重译码的优化。

六. 综合题

1.解:

(1)

2200(ns)2009200)10050(50t )1n (t T max

m

1

i i pipeline =?++++=?-+?=∑= )(ns 220

1

T n

TP 1pipeline

-==

45.45%11

5

4400TP m

t

TP E m

1

i i

≈=?

=??

=∑= (2)瓶颈在3、4段。

变成八级流水线(细分)

850(ns)509850t 1)(n t T max

m

1

i i pipeline =?+?=?-+?=∑=

)(ns 85

1

T n

TP 1pipeline

-==

58.82%1710

8400TP m

ti

TP E m

1

i ≈=?

=??

=∑=

重复设置部件

)(ns 85

1

T n

TP 1pipeline

-==

58.82%17

10

8

85010

400E ≈=??=

2.解:

(1)共需传送4×200 = 800 位。 (2)

3_1 3_2 4_1 4_2 4_3 4_4

1 1

1 1

2 2 2

2

3 3 3

3

4 4 4

4

5 5 5

5 6 6 6

6

7 7 7

7

8 8 9 9 10

10 8

9

10

8

9

10 时间

段1

2

3_1

3_2

4_1

4_4

(3)哈夫曼编码的平均码长为∑

=?

11

1 i

i

i

l

p= 位

(4)可减少传送的二进制码位数是(4 - )×1000 = 770位(5)采用3-5编码(同码长的字符编码可以不唯一)

平均码长为×3 + ×5 =

3-4编码的平均码长为, (同频率不同码长);

2-5编码的平均码长为;

2-4编码的平均码长为。因此最佳编码为3-5编码。

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的 通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。 ·实验原理: 指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤 一.使用WinDLX模拟器,对做如下分析: (1)观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。 (2)考察增加浮点运算部件对性能的影响。 (3)考察增加forward部件对性能的影响。 (4)观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程 一.使用WinDLX模拟器,对做如下分析: } 浮点加、乘、除部件都设置为1,浮点数运算部件的延时都设置为4,如图1: 图1 初始设置 将和加载至WinDLX中,如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组合。 1)数据相关 点击F7,使程序单步执行,当出现R-Stall时停止,运行过程中出现下图3所示,输入整数6。 图3 输入整数6 @ 打开Clock Diagram,可以清楚的看到指令执行的流水线如图4所示。 图4 指令流水线 双击第一次出现R-Stall的指令行,如图5所示。

图5 指令详细信息 对以上出现的情况分析如下: 程序发生了数据相关,R-Stall(R-暂停)表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据;而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。 上述过程发生了WR冲突,即写读相关。为了避免此类冲突, seq r5,r4,0×a的intEX指令延迟了一个周期进行。 由此,相关指令为: 2)控制相关 由图6可以看出,在第4时钟周期:第一条指令处于MEM段,第二条命令处于intEX段,第三条指令出于aborted状态,第四条命令处于IF段。 图 6 指令流水线 }

计算机系统结构试题及答案(二)

计算机系统结构试题及答案 一、单项选择题(本大题共20小题,每小题2分,共20分) 1.以下正确的是()。 A)机箱是计算机的外特性,属系统结构的研究范围 B)集成电路芯片的设计是计算机组成原理的研究范围 C)加法器的设计是计算机实现的研究内容 D)计算机性能评价是计算机系统结构的研究范围 2.在流水线相关处理中,采用()会产生“写-写”相关和“先读后写”相关。 A)猜测法B)顺序流动 C)异步流动 D)相关专用通路3.非线性流水线是指() A)存在分叉连接的流水线B)存在反向连接的流水线 C)一个任务使用多个功能段的流水线D)动态连接的流水线4.网络直径与网络的()有关 A)度B)链路总数 C)结点间通信经过的最多链路数D)通信延迟 5.下列关于存储器的描述,哪个是正确的() A)多体交叉存储器主要解决扩充容量问题 B)Cache的功能全由硬件完成 C)Cache与主存统一编址,即主存空间的某一部分属于Cache D)“主存—外存”的存储层次是为了弥补主存速度的不足 6.在单指令流多数据流计算机中各处理单元必须()。 A)以同步方式在同一时间内执行不同的指令 B)以同步方式在同一时间内执行相同的指令 C)以异步方式在同一时间内执行相同的指令 D)以异步方式在同一时间内执行不同的指令 7.虚拟存储器地址变换是指()。 A)多用户虚地址与实地址如何一一对应 B)程序的逻辑地址变换成主存实地址 C)程序执行时将虚地址变换成对应的实存地址 D)指令的符号地址变换成二进制地址

8.反映网络在理想通信模式下通信带宽的特性是() A)度B)直径C)带宽总和D)等分带宽 9.依据Michael J.Flynn提出的按指令流和数据流的多倍性对计算机系统分类,Illiac IV计算机属于()A)SISD B)SIMD C)MISD D)MIMD 10.全相联地址映象是指()。 A)任何主存页都可装入Cache中任何页的位置 B) 一个虚页只装进固定的主存实页位置 C ) 组之间是固定的,而组内任何主存页可以装入任何Cache页位置 D) 组间可任意装入,组内是固定装入 二、名词解释题(本大题共5小题,每小题4分,共20分)解释每小题所给名词的含义,若解释正确则给分,若 解释错误则无分,若解释不准确或不全面,则酌情扣分。 1.目录表 2.阻塞网络 3. 写直达法 4. 乱序流动 5. 向量链接技术 三、简答题(本大题共4小题,共25分) 1.(5分)存储程序计算机(冯氏机)在系统结构上的主要特点是什么? 2.(5分)在cache容量一定的情况下,增加cache中的块大小能否达到提高cache命中率的效果?为什么? 3.(5分)解释数据相关(局部相关)与控制相关(全局相关)。 4.(10分)有哪几种向量处理方式?它们对向量处理机的结构要求有何不同? 四、综合题(本大题共4小题,共35分) 1. (5分)某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍,而系统运行一程序 的整体性能提高到原来的10倍,试计算该程序中浮点操作所占的比例。

计算机体系结构实验报告二

实验二结构相关 一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。 二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行 周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。 三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程 打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

计算机组织与体系结构实验报告

《计算机组织与体系结构》 实验报告 学号: XXX 姓名:XXX 班级:XXX 指导教师:XXX 时间: 2013年01月 中国矿业大学计算机学院

目录 一基本运算器实验 (2) 1、实验目的 (2) 2、实验设备 (2) 3、实验原理 (2) 4、实验步骤 (3) 5、实验结果 (5) 5、实验体会 (5) 二微程序控制实验 (6) 1、实验目的 (6) 2、实验设备 (6) 3、实验原理 (6) 4、实验步骤 (12) 5、实验体会 (13) 三CPU与简单模型机设计实验 (13) 1、实验目的 (13) 2、实验设备 (13) 3、实验原理 (13) 4、实验步骤 (18) 5、实验流图 (21) 6、实验体会 (25)

实验一基本运算器实验 1. 实验目的 (1) 了解运算器的组成结构。 (2) 掌握运算器的工作原理。 2. 实验设备 PC机一台,TD-CMA实验系统一套。 3.实验原理 本实验的原理如下图所示: 运算器内部含有三个独立运算部件,分别为算术、逻辑和移位运算部件,要处理的数据存于暂存器A和暂存器B,三个部件同时接受来自A和B的数据(有些处理器体系结构把移位运算器放于算术和逻辑运算部件之前,如ARM),各部件对操作数进行何种运算由控制信号S3…S0和CN来决定,任何时候,多路选择开关只选择三部件中一个部件的结果作为ALU的输出。如果是影响进位的运算,还将置进位标志FC,在运算结果输出前,置ALU零标志。ALU中所有模块集成在一片FPGA中。 逻辑运算部件由逻辑门构成,较为简单,而后面又有专门的算术运算部件设计实验,在此对这两个部件不再赘述。移位运算采用的是桶形移位器,一般采用交叉开关矩阵来实现,交叉开关的原理如图1-1-2所示。图中显示的是一个4X4的矩阵(系统中是一个8X8的矩阵)。每一个输入都通过开关与一个输出相连,把沿对角线的开关导通,就可实现移位功能,即: (1) 对于逻辑左移或逻辑右移功能,将一条对角线的开关导通,这将所有的输入位与所使用的输出分别相连,而没有同任何输入相连的则输出连接0。 (2) 对于循环右移功能,右移对角线同互补的左移对角线一起激活。例如,在4位矩阵中使用‘右1’和‘左3’对角线来实现右循环1位。 (3) 对于未连接的输出位,移位时使用符号扩展或是0填充,具体由相应的指令控制。使用另外的逻辑进行移位总量译码和符号判别。

计算机系统结构简答题复习

计算机系统结构简答题复习(1) 1、如果外设要求的通道实际流量十分接近或等于通道具有的最大流量时, 则可能发生局部的数据丢失问题,我们怎样解决(三种方法)? 答: 1. 增大通道最大流量。 2. 动态改变设备优先级。 3. 增加一定数量的缓存器,尤其是优先级比较低的设备 2、解决软件移植最好的办法有哪些? 1.采用系列机 2.采用模拟与仿真 3.采用统一的高级语言 3、证明在浮点数的字长和表数范围一定时,尾数基值rm取2或4具有最高 的表数精度 4、假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段 的时间分别为△t、2△t和3△t。在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。 (1)顺序执行方式。 (2) "取指令"、"分析"和"执行"重叠。 计算机系统结构简答题复习(2) 5、RISC处理机的关键技术有哪四种? 1. 延时转移技术 2. 指令取消技术 3. 重叠寄存器窗口技术 4. 指令流调整技术 6、多处理机有那些基本特点?发展这种系统的主要目的有哪些?多处理机 着重解决那些技术问题? 1. 结构灵活 2. 程序并行 3. 并行任务派生 4. 进程同步 5. 多处理机工作时,要根据任务的多少来调用资源,因此,所需要的资源变化复杂 目的是:利用多台处理机并发执行一个作业,使得执行速度比单处理机块着重解决的问题 着重解决的技术问题:

1. 硬件结构上多处理机,主存,I/O子系统之间应有高带宽,低价格,灵活无规则互联,尽可能不发生信息传送冲突 2. 从并行语言并行算法编译等,最大限度的开发程序并行性 3. 大的任务如何分成多个子任务 4. 从操作系统上解决并行任务分配,调度和资源分配;任务或进程间的同步,死锁竞争等问题的解决 7、向量的处理方式有哪三种?各有何特点? 1. 横向处理方式。向量计算是按行的方式从左至右横向地进行。 2. 纵向处理方式。向量计算是按列的方式自上而下纵向地进行。 3. 纵横处理方式。横向处理和纵向处理相结合的方式。 8、向量处理机实现链接的条件是什么? 1.没有向量寄存器冲突和运算部件冲突。 2. 只有第一个结果送入向量寄存器的那一个周期可以链接。 3. 先行的两条指令产生运算结果的时间必须相等。 4.两条向量指令的向量长度必须相等。 9、提高向量处理机性能的常用技术有那些? 1.链接技术 2.向量循环或分段开采技术 3. 向量递归技术 4.稀疏矩阵的处理技术 10、列出互连网络中四种寻径方式?并指出它们各自优缺点? 1.线路交换。在传递一个信息前需要频繁的建立从源结点到目地结点的物理通路,开销将会很大。 2.存储转发寻址。包缓冲区大,不利于VLSI的实现;时延大,与结点的距离成正比 3.虚拟直通。没有必要等到整个消息全部缓冲后再做路由选择,只要接收到用作寻址的消息头部即可判断,通信时延与结点数无关;同样不利于VLSI 的实现。 4.虫蚀寻址。每个结点的缓冲区小,易于VLSI实现;较低的网络时延。 计算机系统结构简答题复习(3) 11、采用并行处理机的SIMD 计算机主要特点是什么?▲ 1.速度快,而且潜力大 2.模块性好,生产和维护方便 3.可靠性高,容易实现容错和重构 4.效率低。与流水线处理机,向量处理机等比较。依靠是资源重复,而 不是时间重叠,所以其效率要低一些。 5.潜力大。主要依靠增加PE个数,与流水线处理机主要依靠缩短时钟 相比,其提高速度的潜力要大得多。

计算机体系结构试题库—简答题

计算机体系结构试题库 简答题(100题) 1.简述CISC结构计算机的缺点。 答: ●在CISC结构的指令系统中,各种指令的使用频率相差悬殊。据统计,有20%的指 令使用频率最大,占运行时间的80%。也就是说,有80%的指令在20%的运行时 间内才会用到。 ●CISC结构指令系统的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制 时间和成本,而且还容易造成设计错误。 ●CISC结构指令系统的复杂性给VLSI设计增加了很大负担,不利于单片集成。 ●CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。 ●在CISC结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计 算机体系结构技术(如流水技术)来提高系统的性能。 2.RISC结构计算机的设计原则。 答: A.选取使用频率最高的指令,并补充一些最有用的指令; B.每条指令的功能应尽可能简单,并在一个机器周期内完成; C.所有指令长度均相同; D.只有load和store操作指令才访问存储器,其它指令操作均在寄存器之间进行; E.以简单有效的方式支持高级语言。 3.影响现代微处理器主频提升的主要原因由哪些? 答:线延迟、功耗。 4.指令集格式设计时,有哪三种设计方法? 答:固定长度编码、可变长编和混合编码)三种设计方法。

5.简述存储程序计算机(冯·诺依曼结构)的特点。 答: (1)机器以运算器为中心。 (2)采用存储程序原理。 (3)存储器是按地址访问的、线性编址的空间。 (4)控制流由指令流产生。 (5)指令由操作码和地址码组成。 (6)数据以二进制编码表示,采用二进制运算。 6.在进行计算机系统设计时,一个设计者应该考虑哪些因素对设计的影响? 答: 在进行计算机系统设计时,设计者应该考虑到如下三个方面因素的影响: ●技术的发展趋势; ●计算机使用的发展趋势; ●计算机价格的发展趋势。 7.简述程序翻译技术的特点。 答: 翻译技术是先把N+1级程序全部变换成N级程序后,再去执行新产生的N级程序,在执行过程中N+1级程序不再被访问。 8.简述程序解释技术的特点。 答: 解释技术是每当一条N+1级指令被译码后,就直接去执行一串等效的N级指令,然后再去取下一条N+1级的指令,依此重复进行。 9.经典体系结构的定义是什么? 计算机体系结构是机器级程序员所看到的计算机的属性,即概念性结构与功能特性。10.“线延迟墙”指的是什么?

计算机系统结构简答题范文

第1 章系统结构的基本概念 1、为什么将计算机系统看成是多级机器构成的层次结构?P2 2、从机器(汇编)语言程序员的角度来看,以下哪些是不透明的?为什么? 条件码寄存器、磁盘外设、先行进位链、中断寄存器、移位器、I/O端口寄存器 3、就目前通用机来说,计算机系统结构的属性主要包括哪些(03.7)?P3 4、设计指令系统时,以乘法运算为例,简述系统结构设计、计算机组成设计、计算机实现 各应考虑的问题(09.4)。P4 5、简述在设计主存系统时,计算机系统结构、计算机组成、计算机实现各需要考虑的问题 (08.7)。P4 6、简述计算机系统结构、组成和实现三者的相互关系(03.4)。 7、计算机系统结构用软件实现和硬件实现各自的优缺点?P7 8、简述软硬件功能分配的基本原则(06.7)。P8 9、简述计算机系统“由中间开始”设计的基本思想(05.4)其“中间”指的是什么地方?这样 设计的优点是什么(05.7) (07.7)? 10、试述由上往下、由下往上设计思路和存在的问题?P9 11、什么是软件的可移植性(03.7)?为什么要进行软件移植?P10 12、简述采用统一高级语言方法、适用场合、存在问题和应采取的策略。 13、简述统一高级语言的出发点、难点和发展前景(04.4)。 14、采用系列机方法、适用场合、好处、存在问题和应采取的策略P11 15、采用模拟与仿真方法、适用场合、好处、存在问题和应采取的策略。 16、模拟与仿真的主要区别和适合场合是什么(02.4)? 17、软件移植的途径,各受什么限制(08.4)?P14 18、器件的发展对逻辑设计方法的影响(06.4)。P17 19、什么是计算机系统的并行性、开发并行性的目的和两重含义(02.7)?P19 20、从执行程序角度出发,简述并行处理数据的四个等级,给出简单解释,各举一例P19 21、从处理数据的并行上,简述并行处理数据的四个等级,给出简单解释,各举一例P19 22、简要解释提高计算机系统并行性的三个技术途径(07.4),简要解释并举例说明。P20 23、简述计算机系统Flynn分类法的分类角度及类别,并说明各类别的特征(04.7) (09.7)。第2 章数据表示、寻址方式与指令系统 1、数据结构和机器的数据表示之间的关系?引入数据表示的基本原则?P27 2、简述标志符数据表示的主要优点(02.4)。P29 3、标识符数据表示与描述符数据表示有什么不同? 4、使用标志符数据表示会带来什么问题?对此应如何认识。 5、数据描述符和向量数据表示对向量数据结构所提供的支持有什么不同?P30 6、堆栈型机器与通用寄存器型机器的主要区别?堆栈型机器对程序调用的哪些操作提供支持?P32 7、以浮点数数据表示说明数的可表示精度、运算中的精度损失,尾数基值取小对哪个有利

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学 实验报告 课程名称计算机系统结构 计算机学院03班 王陈(11)

目录 实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。 相关性分析结果........................................................................... 错误!未定义书签。 增加浮点运算部件对性能的影响........................................... 错误!未定义书签。 增加forward部件对性能的影响 ............................................ 错误!未定义书签。 转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

计算机系统结构实验指导书-14

北京邮电大学 计算机学院 计算机系统结构实验指导书 王春露邝坚编著 2007.3 – 2013.4

目录z计算机系统结构实验简介 z DLX处理器简介 1. 实验一WINDLX模拟器安装及使用 2. 实验二指令流水线相关性分析 3. 实验三DLX处理器程序设计 4. 实验四代码优化 5. 实验五循环展开(选作)

计算机系统结构实验简介 DLX是一个虚拟处理器。该处理器是加州大学伯克利分校计算机系JohnL .H ennessy教授和斯坦福大学计算机系David A. Patterson教授在其《计算机体系结构:一种定量的方法》一书中提出的。该处理器反映了新一代处理器的特点。通过了解DLX处理器的结构和工作原理,并利用DLX模拟器进行实验,可以帮助学生综合地了解和运用有关处理器指令系统的设计、流水线的设计与实现等方面的知识,有助于计算机系统结构课程内容的理解。 DLX处理器简介 第一节 DLX基本结构 DLX是一种典型的Load/Store型指令集结构。它不仅体现了当今多种机器的指令集结构的共同特点,而且它还体现出未来一些机器的指令集结构的特点。这些机器的指令集结构设计思想都和DLX指令集结构的设计思想十分相似,它们都强调: (1) 具有一套简单的Load/Store指令集; (2) 注重指令流水效率; (3) 简化指令的译码; (4) 高效支持编译器。 DLX是一种易于学习和研究的处理器结构模型。这种类型的机器正在日趋流行,而且其结构非常易于理解。 1.DLX中的寄存器 DLX中有32个通用寄存器(GPRs),分别将其命名为R0,R1…R31。每个通用寄存器长度为32位。 另外,DLX中有32个浮点寄存器(FPRs),分别将其命名为F0,F1…F31。每个浮点寄存器长度为32位。这些浮点寄存器可以用来保存32位的单精度浮点数,或者通过相邻两个浮点寄存器奇偶对FiFi+1(i=0,2,4…,30)来保存双精度浮点数,这种组合而成的64位双精度浮点寄存器在DLX中分别被命名为F0,F2…F28,F30. 2. DLX数据类型 DLX提供了多种长度的整型数据和浮点数据。对整型数据而言,有8位,16位,32位多种长度;对浮点而言,有32位单精度浮点数和64位双精度浮点数。浮点数据表示采用的是IEEE754标准。DLX操作都是对32位整型数据及32或64位浮点数据进行的。 3.DLX的寻址方式和数据传送 DLX提供了寄存器寻址,立即寻址,偏移寻址和寄存器间接寻址四种寻址方式。寄存器寻址字段的大小为5位,用来标识32个通用寄存器或浮点寄存器。

计算机系统结构期末考试试题及其答案

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页 共 24 页 计算机科学系《计算机系统结构》期末考试试卷(A 卷) 2、此试卷适用于计算机科学与技术本科专业。 一 单选题:(10分,每题1分) 1、 ."启动I/O"指令是主要的输入输出指 令,是属于( B ) A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对(B )是透 明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定,组内任何虚页可装入任何实页位

置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写 后读的数据相关,则(B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是(B) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是 (C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

计算机系统结构作业答案第三章(张晨曦)

3.1 -3.3为术语解释等解答题。 3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT, ΔT, 2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。 (1) 顺序执行方式 (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”,“分析指令”与“执行指令”重叠 解: (1) 4NΔT (2) (3N+1) ΔT (3) 2(N+1) ΔT 3.6 解决流水线瓶颈问题有哪两种常用方法? 解: (1) 细分瓶颈段 将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段 重复设置瓶颈段,使之并行工作,以此错开处理任务 3.9 列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。 for(i = 2; i < 100; i=i+1) { a[i] = b[i] + a[i]; -----(1) c[i+1] = a[i] + d[i]; -----(2) a[i-1] = 2*b[i]; -----(3) b[i+1] = 2*b[i]; -----(4) } 解: 输出相关:第k次循环时(1)与第k+1轮时(3) 反相关:第k次循环时(1)和(2)与第k-1轮时(3) 真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4) 3.12 有一指令流水线如下所示 50ns 50ns 100ns 200ns (1)求连续如入10条指令的情况下,该流水线的实际吞吐率和效率 (2)该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。对于你所给出 的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)(m表示流水线级数,n 表示任务数)

计算机系统结构实验报告

计算机系统结构实验报告 一.流水线中的相关 实验目的: 1. 熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: WinDLX模拟器 实验内容和步骤: 1.用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序 用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准 输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。 实验结果: 在载入fact.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,我们得到的结果

计算机体系结构实验报告二

实验二结构相关 一、实验目的: 通过本实验,加深对结构相关的理解,了解结构相关对CPU性能的影响。 二、实验内容: 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行 周期数的百分比。 4. 论述结构相关对CPU性能的影响,讨论解决结构相关的方法。 三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程 打开软件,load structure_d.s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(R-stall 数据相关Stall- 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面的数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关的部件:译码部件。 2)第二个结构相关:ADDI R2, R2, #8,与第一个结构相关类似。由于数据相关, 上一条指令暂停在ID阶段,所以导致下一条指令发生结构相关。

计算机系统结构简答题范文

第 1 章系统结构的基本概念 1、为什么将计算机系统看成是多级机器构成的层次结构?P2 2、从机器(汇编)语言程序员的角度来看,以下哪些是不透明的?为什么? 条件码寄存器、磁盘外设、先行进位链、中断寄存器、移位器、I/O端口寄存器 3、就目前通用机来说,计算机系统结构的属性主要包括哪些(03.7)?P3 4、设计指令系统时,以乘法运算为例,简述系统结构设计、计算机组成设计、计算机实现各 应考虑的问题(09.4)。P4 5、简述在设计主存系统时,计算机系统结构、计算机组成、计算机实现各需要考虑的问题 (08.7)。P4 6、简述计算机系统结构、组成和实现三者的相互关系(03.4)。 7、计算机系统结构用软件实现和硬件实现各自的优缺点?P7 8、简述软硬件功能分配的基本原则(06.7)。P8 9、简述计算机系统“由中间开始”设计的基本思想(05.4)其“中间”指的是什么地方?这样 设计的优点是什么(05.7) (07.7)? 10、试述由上往下、由下往上设计思路和存在的问题?P9 11、什么是软件的可移植性(03.7)?为什么要进行软件移植?P10 12、简述采用统一高级语言方法、适用场合、存在问题和应采取的策略。 13、简述统一高级语言的出发点、难点和发展前景(04.4)。 14、采用系列机方法、适用场合、好处、存在问题和应采取的策略P11 15、采用模拟与仿真方法、适用场合、好处、存在问题和应采取的策略。 16、模拟与仿真的主要区别和适合场合是什么(02.4)? 17、软件移植的途径,各受什么限制(08.4)?P14 18、器件的发展对逻辑设计方法的影响(06.4)。P17 19、什么是计算机系统的并行性、开发并行性的目的和两重含义(02.7)?P19 20、从执行程序角度出发,简述并行处理数据的四个等级,给出简单解释,各举一例P19 21、从处理数据的并行上,简述并行处理数据的四个等级,给出简单解释,各举一例P19 22、简要解释提高计算机系统并行性的三个技术途径(07.4),简要解释并举例说明。P20 23、简述计算机系统Flynn分类法的分类角度及类别,并说明各类别的特征(04.7) (09.7)。第 2 章数据表示、寻址方式与指令系统 1、数据结构和机器的数据表示之间的关系?引入数据表示的基本原则?P27 2、简述标志符数据表示的主要优点(02.4)。P29 3、标识符数据表示与描述符数据表示有什么不同? 4、使用标志符数据表示会带来什么问题?对此应如何认识。 5、数据描述符和向量数据表示对向量数据结构所提供的支持有什么不同?P30

高等计算机体系结构考题部分答案整理与分析(1).

高等计算机体系结构考题部分答案整理与分析(1) ——2002年高体考试真题解析1.填空题 1)第一台通用流水线计算机是:Stretch,即IBM7030 解析:主要是考察流水线技术的相关背景。最早实现流水线技术的计算机应该是使用Stretch,即IBM7030,使用流水线实现了重叠取指令、译码和执 行。其中还设计了避免冲突的ALU旁路技术。在1964年发布了CDC6600是使 用记分板技术实现动态调度流水线机制的机器。而使用保留站机制的Tomasulo 算法是在IBM 360/91中使用的。知识来源于本科课件第二讲 2)有效检测N位加法溢出的方法是: 察看输入最高位的进位是否等于最高位输出的进位 解析:该知识来自本科计算器加减法运算的相关知识。溢出指运算的结果超出了正常的表示范围。加法溢出只可能出现在两个同为正数或同为负数相加 才可以实现。可用以下方法检测:察看输入最高位的进位是否等于最高位输出 的进位。若不相等则容易知道该数据溢出。 3)时间局部性是指: 如果一个信息项正在被访问,那么近期它还会再被访问 解析:考察流水线及性能改进基础——局部性原理。局部性原理:CPU访问存储器时,无论取指令或者存取数据,访问存储单元都趋向于聚集在一个较 小的连续区域中。局部性原理包含时间局部性和空间局部性。时间局部性指 如果一个信息项正在被访问,那么近期它还会再被访问。原因:由程序循环和 堆栈技术造成的。空间局部性指在最近的将来用到的信息很可能在现在正在使 用的信息在空间地址上临近。原因:由指令顺序执行和数组存放造成。 4)流水线存在的三种相关是:数据相关、名字相关和控制相关 解析:考察指令级并行技术的基础相关知识。相关性是程序的特性,一个相关 是否会导致实际的冒险,该冒险是否会造成停顿,这是流水线结构的基本特征。 指令共有三种不同类型的相关:数据相关、名字相关和控制相关。 2.辨析题 1)加深流水线级数一定可以提升处理器性能。 这句话说法不对。当然在一定条件下加深流水线的级数可以加快流水线处理的 并行度,从而提高处理器的性能。但超过一定限度后,流水线级数无法无限制 地增加并提高处理性能。影响和限制流水线级数来提高性能的因素如下:1)指 令流的并行度有限,当流水线级数增加,即流水线深度增加时,因为相关引起 停顿将最终造成CPI的增加。更深的流水线会造成时钟周期的下降,并受到时 钟扭斜和负载的限制。 2)增加页面大小一定可以提升系统整体性能。 这句话说得不对。由于RAM价格下降,存储器变得更大;处理器和存储器之间 的速度差别更大,因此必须增加页面大小。但增加页面大小会使存储器中的内 部碎片变得严重,从而浪费很多存储空间。因此增加页面大小不一定可以提升 系统整体性能。

计算机系统结构实验教程

实验一流水线及流水线中的冲突 实验目的 1.加深对计算机流水线基本概念的理解; 2.理解MIPS结构如何用5段流水线来实现,理解各段的功能和基本操作; 3.加深对数据冲突、结构冲突的理解,理解这两类冲突对CPU性能的影响; 4.进一步理解解决数据冲突的方法,掌握如何应用定向技术来减少数据冲突引起的停顿。 5.加深对指令调度和延迟分支技术的理解; 6.熟练掌握用指令调度技术来解决流水线中的数据冲突的方法; 7.进一步理解指令调度技术和延迟分支技术对CPU性能的改进。 实验平台 指令级和流水线操作级模拟器MIPSsim, 实验内容和步骤 首先要掌握MIPSsim模拟器的使用方法。 一、流水线及流水线中的冲突观察 1. 启动MIPSsim。 2.根据预备知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。(用鼠标双击各段,就可以看到各流水寄存器的内容) 3. 熟悉MIPSsim模拟器的操作和使用方法。 可以先载入一个样例程序(在本模拟器所在的文件夹下的“样例程序”文件夹中),然后分别以单步执行一个周期、执行多个周期、连续执行、设置断点等的方式运行程序,观察程序的执行情况,观察CPU中寄存器和存储器的内容的变化,特别是流水寄存器内容的变化。 4. 勾选配置菜单中的“流水方式”,使模拟器工作于流水方式下。 5.观察程序在流水线中的执行情况,步骤如下: (1)用MIPSsim的“文件”菜单中的“载入程序”来加载pipeline.s(在模拟器所在文 件夹下的“样例程序”文件夹中); (2)关闭定向功能。这是通过在“配置”菜单中去选“定向”(即使得该项前面没有“√” 号)来实现的; (3)用单步执行一周期的方式(“执行”菜单中,或用F7)执行该程序,观察每一周 期中,各段流水寄存器内容的变化、指令的执行情况(代码窗口)以及时钟周期 图; (4)当执行到第10个时钟周期时,各段分别正在处理的指令是: IF: ID:

相关主题