搜档网
当前位置:搜档网 › 计算机体系结构参考1

计算机体系结构参考1

计算机体系结构参考1
计算机体系结构参考1

第一题选择题

1.SIMD是指(B)

A、单指令流单数据流

B、单指令流多数据流

C、多指令流单数据流

D、多指令流多数据流

2.下列那种存储设备不需要编址?D

A. 通用寄存器

B. 主存储器

C. 输入输出设备

D. 堆栈

3.按照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。

A、传统机器语言机器

B、操作系统机器

C、汇编语言机器

D、高级语言机器

4.早期的计算机系统只有定点数据表示,因此硬件结构可以很简单。但是这样的系统有明显的缺点,下面哪一个不是它的缺点:B

A.数据表示范围小

B.单个需要的计算时钟周期多

C.编程困难

D.存储单元的利用率很低

7.下面哪个页面替换算法实际上是不能够实现的?D

A)随机页面替换算法

B)先进先出替换算法

C)最久没有使用算法

D)最优替换算法

9.指令优化编码方法,就编码的效率来讲,那种方法最好?C

A. 固定长度编码

B. 扩展编码法

C. huffman编码法

D. 以上编码都不是

10.在早期冯·诺依曼计算机特征中,机器以(C)为中心。

A、存储器

B、输入输出设备

C、运算器

D、控制器

1.RISC 计算机的指令系统集类型是( C ) 。

A. 堆栈型

B. 累加器型

C. 寄存器—寄存器型

D. 寄存器- 存储器型

2、相联存储器的访问方式是( D )。

A.先进先出顺序访问

B.按地址访问

C.无地址访问

D.按内容访问

3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每—段分别只有—个部件可供使用,并且执行时间分别为Δt、2Δt和3Δt,连续执行n条指令所需要花费的最短时间约为( C )。

(假设“取指令”、“分析”和“执行”可重叠,并假设n足够大)

A.6 nΔt B.2 nΔt C.3 nΔt D.nΔt

6、下列计算机不属于RISC计算机的是(C )。

A.SUN:Ultra SPARC

B.IBM:Power PC620

C.IBM:PC/XT

D.DEC:ALPHA21164

7、哪一点不是RISC的特点?(D )

A. 减少指令的平均执行周期数

B. 重视编译优化技术

C. 减少指令和寻址方式的种类

D. 增加指令的功能

8、哪种兼容方式对系列机来说是必须要求做到的?( B )

A. 向前兼容

B. 向后兼容

C. 向上兼容

D. 向下兼容

9、在计算机系统中,表征系统运行状态的部件是( D )。

A.程序计数器

B.累加计数器

C.中断计数器

D.程序状态字(PSW)

10、存储器读写速率越高,每位的成本也越高,存储容量也小。解决这一问题的主要方法是采用( C )。

A.Cache

B.并行存储器

C.多级存储体系结构

D.缓冲技术

1.计算机系统结构的层次结构按照由高到低的顺序是(A)。

A、高级语言机器级、汇编语言机器级,传统机器语言机器级、微程序机器级

B、高级语言机器级,应用语言机器级、汇编语言机器级、微程序机器级

C、应用语言机器级、传统语言机器级,汇编语言机器级,操作系统机器级

D、应用语言机器级,操作语言机器级,微程序机器级、传统机器语言机器级

2.机器内浮点数都包含阶码和尾数两部分,其中尾数的位数主要影响(A)。

A、能表示数的精度

B、能表示数的范围

C、能表示数的范围和精度

D、能表示数在数轴上分布的离散程序

3.RISC的含义是(C )。

A、Reduced Instruction System Computer

B、Reproduced Instruction Set Computer

C、Reduced Instruction Set Computer

D、Reproduced Instruction System Computer

4.推出系列机的新机器,不能更改的是(A)。

A、原有指令的寻址方式和操作码

B、系统总线的组成

C、数据通路宽度

D、存储芯片的集成度

8.与全相联映象相比,组相联映象的优点是(A)

A、目录表小B、比较对法

C、命中率高D、主存利用率高

10.对于线性流水,在每段经过的时间相等的情况下,流水线的效率与(C )成正比。

A、任务数

B、流水线段数

C、吞吐率

D、排空时间

1. 对应用程序员不透明的是(D )。

A.先行进位链B.乘法器

C.指令缓冲器D.条件码寄存器

2. 以下说法中,不正确的是(B )。

软、硬件功能是等效的,提高硬件功能的比例会

A.提高解题速度B.提高硬件利用率

C.提高硬件成本D.减少所需的存储器用量

4. 数据表示的含义是(D )。

A.表示数据所采用的数制和码制B.数据类型

C.浮点数的表示方式D.硬件能直接识别的数据类型

6.在不同类中断事件优先级中,( D )不受中断屏蔽的控制。

A.中断按键B.外部中断

C.I/O中断D.访管中断

7.与虚拟存储器的等效访问速度无关的是(D )。

A.访存页地址流B.页面替换算法

C.主存的容量D.辅存的容量

8. 页是( )单位,由( )划分,它的长度( )。D

A.逻辑,系统,定长B.逻辑,用户,不定长

C.物理,用户,不定长D.物理,系统,定长

1.某个时期投入市场的机器上编制的软件,不用修改就可运行在比它之后投入市场的机器上,这被称为(D)。

A.向上兼容B.向下兼容C.向前兼容D.向后兼容

2.信息按整数边界存储的主要优点是(A)。

A.访存速度快B.节约主存单元

C.指令字的规整化D.指令的优化

4.按Cache地址映像的块冲突概率从高到低的顺序是(C )。

A.全相联映像、直接映像、组相联映像

B.组相联映像、直接映像、全相联映像

C.直接映像、组相联映像、全相联映像

D.全相联映像、组相联映像、直接映像

5.衡量流水线的主要性能指标是(D )。

A.流水线容量

B.流水线长短

C.流水线规模

D.流水线吞吐率和效率

2.并行处理发展通过( D )途径形成了分布处理系统。

A.提高主频B.时间重叠C.资源重复D.资源共享

3.系列机软件必须保证( D ),一般应做到软件的向上兼容性。

A、向上兼容

B、向下兼容

C、向前兼容

D、向后兼容

1.对机器语言程序员透明的是( B )。

A.中断字B.主存地址寄存器C.通用寄存器D.条件码

按照Flynn的分类,PⅡ的MMX指令采用的是(31)模型,而当前的高性能服务器与超级计算机则大多属于(32)类。

(31)、(32)A.SISD B.SIMD C.MISD D.MIMD

例题1分析

按照Flynn的分类,计算机可分为SISD、SIMD、MISD和MIMD共4类。

PⅡ中开始采用MMX技术,引进了一些新的通用指令,虽然使用了单指令多数据思想,但从整体上说PⅡ仍属于SISD类。

当前的高性能服务器与超级计算机大多具有多个处理器,多任务处理并行处理,基本上都属于MIMD。例题1答案(31)A(32)D

第二题填空题

1、进行仿真工作的机器称为宿主机,而被仿真的机器称为_____目标机________。

3、Cache存储器写保护时,只写入Cache,仅当需块替换时,才将其写回主存,称这种修改方法为______写回法_________法。

4、一般中断是在_____每条指令的尾部______时处理的,而页失效是立即处理的。

1.提高计算机系统并行性的主要技术途径有时间重叠、资源重复和资源共享。

4.在Cache存贮器中,CPU每次写Cache的同时,也写入主存,称这种更新主存块内容的方法为写直达法。

2.计算机组成是计算机体系结构的逻辑实现。计算机实现是计算机组成的物理实现。

3.“主存-辅存”层次的目的是为了弥补主存容量的不足;“Cache-主存”层次的目的是为了弥补主存速度的不足。

4.从计算机体系结构的发展来看,早期的计算机是以运算器为中心的系统结构,而近代的是以存储器为中心的系统结构。

6.计算机体系结构设计和分析中最经常使用的三条基本原则是大概率原则、阿摩达尔定律和局部性原理。

7.Amdahl定律表明系统的加速比依赖于部件可改进比例和加速比两个因素。

9.一条DLX指令最多需要5个时钟周期,它们分别是取指周

期、指令译码周期、执行/有效地址计算周期、存储器周期和写回周期。

10.吞吐率是流水线在单位时间内所完成的任务数或输出结果的数量。11.流水线在连续流动达到稳定状态后所得到的吞吐率叫做最大吞吐率。

12.按照同一时间内各段之间的连接方式来分,流水线可分为动态流水线

和静态流水线。

13.流水线中的相关有结构相关、数据相关和控制相关。

1.并行性包括同时性和并发性二重含义。

5. 解决通用寄存器数相关的办法有推后法和设置相关专用通路。

2. 计算机系统的3T性能目标是1TFLOPS计算能力,1TBYTE主存客量和1TBYTE/S的I/O带宽。

4. 浮点数阶码位数影响数的可表示范围大小,尾数的位数影响数的可表示精度大小。

5.在满足系统性能和总线流量的前提下,可以采用总线的功能组合、并/串-串/并转换、信息编码等方式来减少总线的线数。

8. 段页式虚拟存贮器的内部地址映象表机构有段表和页表两部分。

9.在m段组成的流水线中,设各段经过的时间不同,则在连续完成n个任务时流水线的效率为

10.全局相关指已进入流水线的转移指令和其后续指令之间的相关。

1.中断响应时间是指_______从发出中断请求到进入中断处理程序这段时间_ ______。

3.对于计算机体系结构,计算机组成和计算机实现三个概念来说,_____计算机组成____着眼于机器级内各事件排序方式_____计算机系统结构_______着眼于对传统机器级界面的确定,______计算机实现______着眼于微程序设计。

5.中断系统的软硬件功能分配实际上就是在中断响应硬件和中断处理程序软件之间的功能分配。

6.数据宽度是指在期间所传送的数据总量。

7.评价存贮器性能的基本要求是大容量、高速度和低价格。

8.程序的局部性包括时间上的局部性和空间上的局部性

9.在“一次重叠”解释时,第K+1条指令需要等第K条指令执行后才能形成,称此时发生了指令相关。

10.中断屏蔽不能改变中断响应的优先次序,但是能够动态改变中断处理程序次序。

一、判断题

1.可以说向后兼容是系列机的根本特征。(√ )3.在数据描述符中,描述符与数据分开存放,主要用于描述单个数据的特征。(×)

6.为了动态调节中断处理程序实际执行完的次序,需要在中断级请求源和中断响应排队器的入口端之间加设中断屏蔽字寄存器和相应的控制门电路。(√ )

7.页面失效请求可以在每条指令执行到末尾时检测,以便在此时看是否调页。(×)

8.Cache存贮器等效访问速度达不到接近于第一级Cache的,可以增加Cache容量来解决。(√ )

9.对于通用寄存器变址相关的情况,有可能会出现“一次相关”,而不会出现“二次相关”。(×)

1.( √ )器件的发展是推动计算机系统向前发展的最直接的动力。

3.( ×)由于RISC简化了指令系统,因此,RISC上的目标程序比CISC上的目标程序要短一些,程序运行的时间就会少一些。

5. ( √ )专用总线的总线数多,系统流量大,I/O系统不适宜用专用总线。

8.( √ )存储器采用单体单字,还是多体交叉并行存取,对系统结构设计应是透明的。

10. ( ×)从软硬功能分配看,静态流水线把功能负担较多地加到硬件上,而动态流水线则较多地加到软件上,以提高流水的效能。

3.( × )在集中式定时查询方式中,共享总线的部件都有各自的一对"总线请求"和"总线准许"线。

4.( × )页面失效请求可以在每条指令执行到末尾时检测,以便在此时看是否调页。

3、若Cache未命中,应将程序挂起,同时调块。(×)

5、只要将子过程进一步细分,就可以使流水吞吐率进一步提高。(×)

1.系统是否设浮点运算指令,对计算机系统结构是透明的。(错)

2.基址寻址支持程序的动态再定位,变址寻址支持程序的循环。(对)

存储转发寻径:

在存储转发网络中包是信息流的基本单位,每个结点有一个包缓冲区。包从源结点经过一系列中间结点到达目的结点。当一个包到达一个中间结点时,它首先被存入缓冲区,当所要求的输出通道和接收结点的包缓冲区可使用时,然后再将它传送给下一个结点。

1.系列机

所谓系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。系列机方法能够在具有相同系统结构的各种机器之间实现软件移植。

5.MIPS

MIPS= =

6.MFLOPS

MFLOPS=

7.命中率存储器替换策略

命中率是为存储器层次结构中任意两个相邻层次而定义的一个概念,当在Mi中找到一个信息项时,称之为命中,反之称之为缺失。在Mi层的命中率就是信息项可在Mi中找到的概率。

11.存储转发寻径

在存储转发网络中包是信息流的基本单位,每个结点有一个包缓冲区。包从源结点经过一系列中间结点到达目的结点。当一个包到达一个中间结点时,它首先被存入缓冲区,当所要求的输出通道和接收结点的包缓冲区可使用时,然后再将它传送给下一个结点。

13.静态流水线

在同一时间内,多功能流水线中的各个功能段只能按照一种固定的方式连接,实现一种固定的功能。只有当按照这种连接方式工作的所有任务都流出流水线之后,多功能流水线才能重新连接,以实现其他功能。

14.存储器带宽

存储器带宽为存储器在连续访问时的数据吞吐速率。带宽的单位通常是每秒钟传送的位数或字节数。

15.Amdahl定律:

系统中对某一部件或某种执行方式取采了改进后,整个系统性能的提高与两种因素有关(1)改进部分的使用频率或占总执行时间的比例有关;(2)与改进部分在采用改进措施后比较有改进措施前性能提高的倍数有关。

:加速比

:改进部分的使用频率或占总执行时间的比例

:改进部分在改进前的性能与改进后的性能之比,(也就是改进部分性能提高的倍数)

1. 结构相关——当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序(2分),使得读/写操作顺序不同于它们非流水实现时的顺序(2分),将导致数据相关

2. 程序的局部性原理——程序在执行时所访问的地址不是随机的,而是相对簇聚(3分);这种簇聚包括指令和数据两部分(1分)。

3. CPI——指令时钟数(Cycles per Instruction)(4分)。

4. 并行性:包含同时性和并发性.是指在同一时刻或同一时间间隔内完成两种以上性质相同或不同的工作。

5. 组相联映象:主存中的每一块只能映象到Cache中唯一一个特定块的位置,即第i块映象到Cache中物理地址应为i mod 2ncb块的位置上。

6. 模拟:用一种机器语言解释另一种机器语言的方式.

仿真:用微机解释机器语言的方式。(4分)

17、Flynn分类法:计算机系统结构的一种分类方法.按照同时执行的指令流与数据流在

系统中的数目,将系统结构分为:SISD单指令单数据流,SIMD多指令流多数据流,MISD 多指令流单数据流,MIMD多指令流多数据流。

18、物理地址cache存储系统:物理地址cache存储系统是指cache、主存、磁盘这三个存储器分别构成"cache-主存"和"主存-磁盘"两个存储系统

19、非阻塞网络:

非阻塞网络:逻辑上的交叉开关网络,除非存在不同输入端口向同一输出端口发送消息,否则消息通信将不会阻塞。

请描述存储器访问的时间局部性和空间局部性,并讲述其原因。

时间上的局部性指的是最近的将来要用到的信息很可能是现在正在使用的信息,这主要是由程序的循环和堆栈等造成的。

空间上的局部性指的是最近的将来要用到的信息很可能与现在正在使用的信息在空间上是相邻或相近的,这主要是由于指令通常是顺序执行的和数据是集簇存放所造成的。

15、简述流水线技术的特点

⑴流水过程由多个相联系的子过程组成,每个过程称为流水线的"级"或"段"。

⑵流水技术适合于大量重复的时序过程。

13、简述SIMD计算机的分布式存储器与共享存储器的异同。

SIMD计算机的分布式存储器与共享存储器的相同点都存在互联网络。不同点式在共享内存方案中,共享的多体并行存储器通过对准网络与各处理单元相连。在分布内存方案中,每个处理单元有自己的本地存储器,处理单元有自己的本地存储器,处理单元之间的数据通过数据寻径网络完成。

15、程序中有哪两类相关,分别可以采取什么方法来解决?

(1) 数据相关

数据相关指在执行本条指令的过程中,如果用到的指令、操作数、变址偏移量等是前面指令的执行结果,则必须等待前面的指令执行完成,并把结果写到主存或通用寄存器中之后,本条指令才能开始执行。

可以采取设置专用数据通路、延迟执行等方法来解决数据相关。

(2) 控制相关

控制相关指由条件分支指令、转子程序指令、中断等引起的相关。可以采取静态分支预测技术、动态分支预测技术、提前形成条件码等来解决控制相关。

14、简述超标量处理机的特点

超标量处理机一般具有多于一条的流水线,一台m度的超标量处理机可同时发射m条指令,指令的发射等待时间为1个时钟,指令的并行度为m。

12、数据类型、数据表示和数据结构之间的关系是什么?在设计一个计算机系统时,确定数据表示的原则主要有哪几个?

数据类型有多种多样,如文件、图、表、树、阵列、队列、链表、栈、向量、串、实数、整数、布尔数、字符等。数据表示研究的是计算机硬件能够直接识别,可以被指令系统直接调用的那些数据类型。数据结构研究的是面向系统软件,面向应用领域所需要处理的各种数据类型,研究这些数据类型的逻辑结构和物理结构之间的关系,并给出相应的算法。

确定哪些数据类型用数据表示来实现的原则主要有三个,一是缩短程序的运行时间,二是减少CPU与主存储器之间的通信量,三是这种数据表示的通用性和利用率。

16、实现软件移植的主要途径有哪些?它们存在什么问题?适用于什么场合?

(1)采用系列机方法,只能在具有相同系统结构的各种机器之间实现软件移植,一般是一个厂家生产的机器

(2)采用模拟与仿真的方法,可在不同系统结构的机器之间相互移植软件,对于使用频率较高的指令,尽可能用仿真方法以提高运算速度,而对于使用频率低且难于用仿真实现的指令则用模拟方法来实现。

(3)采用统一的高级语言方法,可以解决结构相同或完全不同的各种机器上的软件移植,但是,要统一高级语言,语言的标准化很重要,但难以在短期内解决。

1.设计RISC机器可采用的基本技术有哪些?

设计RISC机器的基本技术:按设计RISC机器的一般原则来精选和优化设计指令系统;逻辑上采用硬联组合电路为主,适当辅以微程序控制;在CPU内设置大量寄存器,采用重叠寄存器组的窗口;指令采用重叠和流水的方式解释,采用延迟转移;优化设计高质量的编译程序。

19.简述计算机系统设计中软硬件取舍3原则。

1)在现有器件的条件下,系统要有较高的性能价格比;

2)不要不合理地限制各种组成、实现技术的采用;

3)硬件的设计要考虑如何为软件提供更好的支持。

2. 简述RISC结构的设计原则。

(1) 选取使用频率最高的指令,并补充一些最有用的指令;

(2) 每条指令的功能应尽可能简单,并在一个机器周期内完成;

(3) 所有指令长度均相同;

(4) 只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行

(5) 以简单有效的方式支持高级语言。

3. 解决流水线结构相关的方法有哪些?

(1)流水化功能单元

(2)资源重复

(3)暂停流水线

4.组相联Cache比相同容量的之直接映象Cache的失效率低。由此是否可以得出结论:采用组相联Cache一定能带来性能上的提高?为什么?

答:不一定。因为组相联命中率的提高是以增加命中时间为代价的,组相联需要增加多路选择开关。

11、一条流水线连接图如下所示,画出100条指令连续通过该流水线的时空图,并计算该流水线的加速比。(其中)

参考答案:

顺序执行的时间为T0=6×100=600ns

采用流水方式执行的时间为T1=3×99+6=303

加速比S=T0/T1=600/303=1.98

12、

13、双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为Δt, Δt, 2Δt, Δt,“加”由1→2→4组成,“乘”由1→3→4组成,输出可直接返回输入或锁存。现执行

(1)画出流水时空图,标出流水线入端数据变化情况。

(2)求运算全部完成所需的时间和流水线效率。

(3)找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。

部件

①②③④⑤⑥结果

输入

a1 a2 a3 a4 a1+b1 a2+b2 a3+b3 a4+b4 ①③⑤

b1 b2 b3 b4 c1 c2 c3 c4 ②④⑥

Δt

4

3

2

1

(1)

(2)由上图可知,全部运算完的时间是23Δt。

(3)

4

3-2

3-1

2

1

输入

a1 a2 a3 a4 a1+b1 a2+b2 a3+b3 a4+b4 ①③⑤b1 b2 b3 b4 c1 c2 c3 c4 ②④⑥

①②③④⑤⑥结果

部件

由上图可知,流水时间为20Δt。

2.在下列不同类型的处理机上做向量运算:D=(A+B)*C,向量长度均为4,每个周期的时间为10ns。分别计算所需的最短时间,写出简要计算过程。(15分)

1).SISD单处理机,有一个通用运算部件,每3个周期做完一次加法,或每4个周期做完一次乘法。(5分)

2).流水线处理机,有一条两功能静态流水线,加法经过其中的3段,乘法经过其中的4段,每段的延迟时间均为一个周期。(5分)

3).向量处理机,有独立的加法器和乘法器,加法器采用3段流水线,乘法器采用4段流水线,每段的延迟时间均为一个周期,采用向量链接方式工作。(5分)

解:

1)10ns×4×(3+4)=280ns,4次加法和4次乘法串行执行

2)10ns×(6+7)=130ns,流水线执行4次加法需要6个周期,流水线执行4次乘法需要7个周期

3)10ns×(7+3)=100ns,得到第1个结果需要7个周期,另外3个结果需要3个周期

9、在一个Cache存储系统中,主存储器的访问周期、存储容量和单位价格分别为60ns、64MB和10元/NB,Cache的访问周期、存储容量和单位价格分别为10ns、512KB和100元/MB,Cache的命中率为0.98。

计算这个Cache存储系统的等效访问周期、存储容量和单位价格。

这个Cache存储系统的等效访问周期:

T=TcH+Tm(1-H)

=10ns×0.98+60ns×(1-0.98)

=11ns

等效存储容量:

S=64MB

等效单位价格:

C=(CcSc+CmSm)/(Sc+Sm)

=(100×0.5+10×64)/(0.5+64)

=10.7(元/MB)

8、1台向量计算机1次只能以下述两种执行方式中的一种运行:一种是向量方式,执行速度Rv为10MFLOPS;另一种是标量方式,执行速度Rs为1MFLOPS。设α是该计算机的典型程序代码中可向量化部分的百分比。

(a)推导出该计算机平均执行速度R的公式

(b)要使R达到7.5MFLOPS,问向量化百分比α应多大?

(c)假设Rs=1MFLOPS,α=0.7,要使R达到2MFLOPS,问Rv应为多大?

参考答案:

(a)

(b)R=7.5,则,α=0.963

(c),

则MFLOPS

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示: (1 用两给出条指 (1) (24? 变八级流水线(细分) ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。

(2) (3)重复设置部件 吞吐率提高倍数= t t ??2310 75 =1.64 3.5 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 +B 4;再计算由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。 段23 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机体系结构解

计算机体系结构解

————————————————————————————————作者:————————————————————————————————日期:

第一章计算机组成原理 本部分要求掌握计算机方面的基础知识,包括计算机的发展、计算的系统组成、基本组成和工作原理、计算机的数制数据表示以及运算校验、指令系统以及计算机系统的安全等基础性的知识。内容多而且复杂,尤其是有关计算机硬件方面的内容,很细而且灵活性不高,知识量相当大,掌握这部分一定要多下功夫,学会取舍、把握重点、抓住要害。 1.1 考试大纲及历年考题知识点 1.1.1 大纲要求 考试要求: 1 掌握数据表示、算术和逻辑运算; 2 掌握计算机体系结构以及各主要部件的性能和基本工作原理考试范围 1 计算机科学基础 1.1 数制及其转换二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 ?数的表示(原码、反码、补码、移码表示,整数和实数的机内表示,精度和溢出)?非数值表示(字符和汉字表示、声音表示、图像表示) ?校验方法和校验码(奇偶校验码、海明校验码、循环冗余校验码) 1.3 算术运算和逻辑运算 ?计算机中的二进制数运算方法 ?逻辑代数的基本运算和逻辑表达式的化简 2.计算机系统知识 2.1 计算机系统的组成、体系结构分类及特性 ?CPU 和存储器的组成、性能和基本工作原理 ?常用I/O 设备、通信设备的性能,以及基本工作原理 ?I/O 接口的功能、类型和特性 ?I/O 控制方式(中断系统、DMA、I/O 处理机方式) ?CISC/RISC,流水线操作,多处理机,并行处理 2.2 存储系统 ?主存-Cache 存储系统的工作原理 ?虚拟存储器基本工作原理,多级存储体系的性能价格 ?RAID 类型和特性 2.3 安全性、可靠性与系统性能评测基础知识 ?诊断与容错 ?系统可靠性分析评价 ?计算机系统性能评测方式 1.2 计算机科学基础 1.2.1 数制及其转换 1、R 进制转换成十进制的方法按权展开法:先写成多项式,然后计算十进制结果. 举例: (1101.01)2=1×2^3+1×2^2+0×2^1+1×2^0+ 0×2^-1+1×2^-2 =8+4+1+0.25=13.25 (237)8=2×8^2+3×8^1+7×8^0 =128+24+7=159 (10D)16=1×16^2+13×16^0=256+13=269

计算机系统结构网上作业

计算机系统结构作业参考答案 一、 1、试述现代计算机系统的多级层次结构。 计算机系统具有层次性,它由多级层次结构组成。从功能上计算机系统可分为五个层次级别:第一级是设计级。这是一个硬件级,它由机器硬件直接执行。 第二级是一般机器级,也称为机器语言级。它由微程序解释系统.这一级是硬件级。 第三级是操作系统级,它由操作系统程序实现。这些操作系统由机器指令和广义指令组成,这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。 第四级是汇编语言级。它给程序人员提供一种符号形式的语言,以减少程序编写的复杂性。这一级由汇编程序支持执行。 第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。 答:一般原则: (1)确定指令系统时,只选择使用频度很高的指令及少量有效支持操作系统,高级语言及其它功能 的指令,大大减少指令条数,一般使之不超过100条; (2)减少寻址方式种类,一般不超过两种; (3)让所有指令在一个机器周期内完成; (4)扩大通用寄存器个数,一般不少于32个,尽量减少访存次数; (5)大多数指令用硬联实现,少数用微程序实现; (6)优化编译程序,简单有效地支持高级语言实现。

基本技术: (1)按RISC一般原则设计,即确定指令系统时,选最常用基本指令,附以少数对操作系统等支持最有用的指令,使指令精简。编码规整,寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现,功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即:为了减少访存,减化寻址方式和指令格式,简有效地支持高级语言中的过程调用,在RISC机器中设有大量寄存嚣,井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令,即可让本条指令执行与下条指令预取在时间上重叠。另外,将转移指令与其前面的一条指令对换位置,让成功转移总是在紧跟的指令执行之后发生,使预取指令不作废,节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配,减少访存次数。不仅要利用常规手段优化编译,还可调整指令执行顺序,以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别 (1)全相连映像 主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分,Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同,Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关,Cache必须对每个块和块自身的地址加以存储。当请求数据时,Cache控制器要把请求地址同所有的地址加以比较,进行确认。 (2)直接映像 把主存分成若干区,每区与Cache大小相同。区内分块,主存每个区中块的大小和Cache 中块的大小相等,主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中,即相同块号的位置。主存地址分为三部分:区号、块号和块内地址,Cache地址分为:块号和块内地址。直接映像方式下,数据块只能映像到Cache中唯一指定的位置,故不存在替换算法的问题。它不同于全相连Cache,地址仅需比较一次。 (3)区别: 全相连映像比较灵活,块冲突率低,只有在Cache中的块全部装满后才会出现冲突,Cache 利用率高。但地址变换机构复杂,地址变换速度慢,成本高。 直接映像的地址变换简单、速度快,可直接由主存地址提取出Cache地址。但不灵活,块冲突率较高,Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成?

计算机系统结构有详细答案

(仅供参考,不作为考试标准), 选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员 。意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速 。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同 栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法 象联组,相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高 是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路 令指条下析分后推C) 令指条下行执后推D) 流的用采,时关据数到,中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

高级计算机体系结构作业汇总(非标准答案)

1.Explain the Concepts Computer Architecture 系统结构 由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。 Advanced CA 高级系统结构 新型计算机系统结构。基于串行计算机结构,研究多指令多数据计算机系统,具有并发、可扩展和可编程性。为非冯式系统结构。 Amdahl law Amdahl定律 系统中某部件由于采用某种方式时系统性能改进后,整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。 SCALAR PROCESSING 标量处理机 在同一时间内只处理一条数据。 LOOK-AHEAD 先行技术 通过缓冲技术和预处理技术,解决存储器冲突,使运算器能够专心与数据的运算,从而大幅提高程序的执行速度。 PVP 向量型并行计算处理机 以流水线结构为主的并行处理器。 SMP 对称多处理机系统 任意处理器可直接访问任意内存地址,使用共享存储器,访问延迟、带宽、机率都是等价的。MPP 大规模并行计算机系统 物理和逻辑上均是分布内存,能扩展至成百上千处理器,采用专门设计和定制的高通信带宽和低延迟的互联网络。 DSM 分布式共享存储系统 内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。 COW 机群系统 每个节点都是一个完整的计算机,各个节点通过高性能网络相互连接,网络接口和I/O总线松耦合连接,每个节点有完整的操作系统。 GCE 网格计算环境 利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。 CISC 复杂指令集计算机

通过设置一些复杂的指令,把一些原来由软件实现的常用功能改用硬件实现的指令系统实现,以此来提高计算机的执行速度。 RISC 精简指令集计算机 尽量简化计算机指令功能,只保留那些功能简单,能在一个节拍内执行完的指令,而把复杂指令用段子程序来实现。 VMM 虚拟机监视器 作为软硬件的中间层,在应用和操作系统所见的执行环境之间。 SUPERCOMPUTER 超级计算机 数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM 共享虚拟存储器 存储器虚拟化为一个共享的存储器,并提供单一的地址空间。 MAINFRAME 大型计算机 作为大型商业服务器,一般用于大型事务处理系统,特别是过去完成的且不值得重新编写的数据库应用系统方面。 COMPUTER SYSTEM ON CHIP 片上计算机系统 在单个芯片上集成的一个完整系统。 PARALLEL ARCHITECTURE INTO SINGLE CHIP 单片并行结构 在单个芯片上采用的并行体系结构 MOORE law Moore定律 当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。 UMA 一致存储访问 采用集中式存储的模式,提供均匀的存储访问。 NUMA 非一致存储访问 内存模块局部在各个结点内部,所有局部内存模块构成并行机的全局内存模块。 COMA 全高速缓存存储访问 采用分布式存储模式,通过高速缓存提供快速存储访问。 CC-NUMA 全高速缓存非一致性均匀访问 存在专用硬件设备保证在任意时刻,各结点Cache中数据与全局内存数据的一致性。NORMA 非远程存储访问

计算机体系结构参考1

第一题选择题 1.SIMD是指(B) A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2.下列那种存储设备不需要编址?D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3.按照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4.早期的计算机系统只有定点数据表示,因此硬件结构可以很简单。但是这样的系统有明显的缺点,下面哪一个不是它的缺点:B A.数据表示范围小 B.单个需要的计算时钟周期多 C.编程困难 D.存储单元的利用率很低 7.下面哪个页面替换算法实际上是不能够实现的?D A)随机页面替换算法 B)先进先出替换算法 C)最久没有使用算法 D)最优替换算法

9.指令优化编码方法,就编码的效率来讲,那种方法最好?C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10.在早期冯·诺依曼计算机特征中,机器以(C)为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A.先进先出顺序访问 B.按地址访问 C.无地址访问 D.按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每—段分别只有—个部件可供使用,并且执行时间分别为Δt、2Δt和3Δt,连续执行n条指令所需要花费的最短时间约为( C )。 (假设“取指令”、“分析”和“执行”可重叠,并假设n足够大) A.6 nΔt B.2 nΔt C.3 nΔt D.nΔt 6、下列计算机不属于RISC计算机的是(C )。 A.SUN:Ultra SPARC

计算机体系结构知识点

目录 第一章计算机系统结构基本概念 (2) (一) 概念 (2) (二) 定量分析技术 (3) (三) 计算机系统结构发展 (4) (四) 计算机的并行性 (5) 第二章计算机指令集结构 (7) 一. 指令集结构的分类 (7) 二. 寻址方式 (7) 三. 指令集结构的功能设计 (8) 四. 指令格式的设计 (10) 五. MIPS指令集结构 (10) 第三章流水线技术 (14) 一. 流水线的基本概念 (14) 二. 流水线的性能指标 (14) 三. 流水线的相关与冲突 (16) 四. 流水线的实现 (18) 第四章指令集并行 (18) 付志强

第一章计算机系统结构基本概念 (一)概念 什么是计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性. 透明性:在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念成为透明性. 常见计算机系统结构分类法 冯氏分类法(冯泽云):按最大并行度对计算机进行分类. Flynn分类法:按指令流和数据流多倍性进行分类 ①单指令流单数据流 ②单指令流多数据流 ③多指令流单数据流(不存在) ④多指令流多数据流 付志强

(二)定量分析技术 Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比. 加速比=系统性能 改进后 系统性能 改进前 = 总执行时间 改进前 总执行时间 改进后 加速比依赖于以下两个因素 ①可改进比例 ②部件加速比 CPU性能公式 CPU时间 CPU时间=执行程序所需时间的时钟周期数x时钟周期时间(系统频率倒数) CPI(Cycles Per Instruction) CPI =执行程序所需时钟周期数/所执行指令条数 ∴CPU时间= IC x CPI x 时钟周期时间 可知CPU性能取决于一下三个方面 ①时钟周期时间:取决于硬件实现技术和计算机组成 付志强

计算机体系结构_第一次作业

计算机体系结构 第一章 1.11 Availability is the most important consideration for designing servers, followed closely by scalability and throughput. a. We have a single processor with a failures in time(FIT) of 100. What is the mean time to failure (MTTF) for this system? b. If it takes 1 day to get the system running again, what is the availability of the system? c. Imagine that the government, to cut costs, is going to build a supercomputer out of inexpensive computers rather than expensive, reliable computers. What is the MTTF for a system with 1000 processors? Assume that if one fails, they all fail. 答: a. 平均故障时间(MTTF)是一个可靠性度量方法,MTTF的倒数是故 障率,一般以每10亿小时运行中的故障时间计算(FIT)。因此由该定义可知1/MTTF=FIT/10^9,所以MTTF=10^9/100=10^7。b. 系统可用性=MTTF/(MTTF+MTTR),其中MTTR为平均修复时间, 在该题目中表示为系统重启时间。计算10^7/(10^7+24)约等于1. c. 由于一个处理器发生故障,其他处理器也不能使用,所以故障率 为原来的1000倍,所以MTTF值为单个处理器MTTF的1/1000即10^7/1000=10^4。 1.14 In this exercise, assume that we are considering enhancing

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。 CPI:每条指令执行的平均时钟周期数。 测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。 存储程序计算机:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。 向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。 向后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能

计算机系统结构第1-8章部分作业答案复习课程

计算机系统结构第1-8章部分作业答案

第一章 1.6 某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下: 求该计算机的有效CPI 、MIPS 和程序执行时间。 解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (或 259 460 ) (2)MIPS 速率=f/ CPI =400/1.776 =225.225MIPS (或 259 5180 MIPS) (3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/ 400=575μs 1.9 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。具体数据如下表所示: (1)改进后,各类操作的加速比分别是多少? (2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 解:根据Amdahl 定律Se Fe Fe S n + -= )1(1可得

4类操作均改进后,整个程序的加速比: 2.16)1(1 ≈+-=∑∑i i i n S F F S 1.10 第二章 变长编码,哈夫曼编码 第三章 3.12 有一条指令流水线如下所示: (1)求连续输入10条指令的情况下,该流水线的实际吞吐率和效率。 (2)该流水线的瓶颈在哪一段?请采用两种不同的措施消除此瓶颈。对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解: (1)本题主要考察对各功能段用时不等的线性流水线的性能计算公式的掌握情况。 2200(ns) 2009200)10050(50t n t T max k i i =?++++=?-+?=∑=)1(1 流水 )(ns 220 1 T n TP 1-==流水

计算机体系结构试题汇总

计算机系统结构 姓名:学号: 一、简答题(每小题10分,共20分) 1.简述使用物理地址进行DMA存在的问题,及其解决办法。 2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。 二、(60分)现有如下表达式: Y=a ×X 其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。 1.请写出实现该表达式的MIPS代码。 2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。 3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。 4.根据3的结果说明流水线相关对CPU性能的影响。 三、(20分)请分析I/O对于性能的影响有多大?假设: 1.I/O操作按照页面方式进行,每页大小为16 KB,Cache块大小为64 B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。 2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。 3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

《计算机体系结构》在线作业二

北交《计算机体系结构》在线作业二 一、单选题(共20 道试题,共60 分。) 1. 按照M ·弗林对处理机并行性定义的分类原则,阵列机ILLIAC —IV 是( )。 A. SISD B. SIMD C. MISD D. MIMD 正确答案: 2. 输入输出系统硬件的功能对( )是透明的。 A. 操作系统程序员 B. 应用程序员 C. 系统结构设计人员 D. 机器语言程序设计员 正确答案: 3. 浮点数尾数基值rm=8,尾数数值部分长6位,可表示规格化正尾数的个数是()。 A. 56个 B. 63个 C. 64个 D. 84个 正确答案: 4. 从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。 A. 计算机软件所要完成的功能 B. 计算机硬件的全部组成 C. 编程要用到的硬件组织 D. 计算机各部件的硬件实现 正确答案: 5. 对机器语言程序员透明的是( )。 A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码 正确答案: 6. 通道方式输入输出系统中,对优先级高的磁盘等高速设备,适合于连接( )。 A. 字节多路通道 B. 选择通道 C. 数组多路通道

D. 字节及数组多路通道 正确答案: 7. 设16 个处理器编号分别为0 ,1 ,2 ,…,15 ,用PM 2-0 互联函数时,第13 号处理机与第( ) 号处理机相联。 A. 12 B. 9 C. 11 D. 5 正确答案: 8. 对系统程序员不透明的应当是( )。 A. Cache存贮器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存贮器 正确答案: 9. 对应用程序员不透明的是( )。 A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器 正确答案: 10. 系列机软件应做到( )。 A. 向前兼容,并向上兼容 B. 向后兼容,力争向上兼容 C. 向前兼容,并向下兼容 D. 向后兼容,力争向下兼容 正确答案: 11. 动态数据流机最突出的特点是使( )。 A. 数据流令牌无标号 B. 需要程序记数器来实现 C. 令牌带上标号 D. 同步由门(Latch)寄存器来实现 正确答案: 12. 计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是( )。 A. 汇编语言机器级――操作系统机器级――高级语言机器级 B. 微程序机器级――传统机器语言机器级――汇编语言机器级 C. 传统机器语言机器级――高级语言机器级――汇编语言机器级 D. 汇编语言机器级――应用语言机器级――高级语言机器级 正确答案: 13. 用户高级语言源程序中出现的读写(I/O) 语句,到读写操作全部完成,需要通过( )共同完成。 A. 编译系统和操作系统 B. I/O 总线、设备控制器和设备 C. 操作系统和I/O 设备硬件

-计算机系统结构(有详细答案)

(仅供参考,不作为考试标准), 选择题(30分,每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员 在计算机系统设计时,为了提高系统性能,应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度 重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度 为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法 与全相联映象相比,组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令 流水操作中,遇到数据相关时,采用的解决办法有________。 A)用优化编译器检测,通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络 虫蚀寻径以流水方式在各寻径器是顺序传送的是________。 授课:XXX

第一部分计算机系统组成及说明

第一部分:计算机系统组成及说明 一、计算机系统组成 一个完整的计算机系统通常是由硬件系统和软件系统两大部分组成的。(一)硬件(hardware) 硬件是指计算机的物理设备,包括主机及其外部设备。具体地说,硬件系统由运算器、控制器、存储器、输入设备和输出设备五大部件组成。 ①存储器。存储器是计算机用来存放程序和原始数据及运算的中间结果和最后结果的记忆部件。 ②运算器。运算器对二进制数码进行算术或逻辑运算。 ③控制器。控制器是计算机的“神经中枢”。它指挥计算机各部件按照指令功能的要求自动协调地进行所需的各种操作。 ④输入/输出设备(简称I/O设备)。计算机和外界进行联系业务要通过输入输出设备才能实现。输入设备用来接受用户输入的原始数据和程序,并将它们转换成计算机所能识别的形式(二进制)存放到内存中。输出设备的主要功能是把计算机处理的结果转变为人们能接受的形式,如数字、字母、符号或图形。 (二)软件(software) 软件是指系统中的程序以及开发、使用和维护程序所需要的所有文档的集合。包括计算机本身运行所需的系统软件和用户完成特定任务所需的应用软件(三)硬件和软件的关系

硬件是计算机的基础,软件对硬件起辅助支持作用,二者相辅相成,缺一不可,只有有了软件的支持,硬件才能充分发挥自己的作用。 二、计算机工作原理 (一)冯·诺依曼设计思想 计算机问世50年来,虽然现在的计算机系统从性能指标、运算速度、工作方式、应用领域和价格等方面与当时的计算机有很大的差别,但基本体系结构没有变,都属于冯·诺依曼计算机。 冯·诺依曼设计思想可以简要地概括为以下三点: ①计算机应包括运算器、存储器、控制器、输入和输出设备五大基本部件。 ②计算机内部应采用二进制来表示指令和数据。每条指令一般具有一个操作码和一个地址码。其中,操作码表示运算性质,地址码指出操作数在存储器的位置。 ③将编好的程序和原始数据送入内存储器中,然后启动计算机工作,计算机应在不需操作人员干预的情况下,自动逐条取出指令和执行任务。 冯·诺依曼设计思想最重要之处在于他明确地提出了“程序存储”的概念。他的全部设计思想,实际上是对“程序存储”要领的具体化。

计算机体系结构第一次作业

问答题(共4道题) 1.什么是存储系统? 答:存储系统是指计算机中由存放程序和数据的各种存储设备、控制部件及管理信息调度的设备(硬件)和算法(软件)所组成的系统。计算机的主存储器不能同时满足存取速度快、存储容量大和成本低的要求,在计算机中必须有速度由慢到快、容量由大到小的多级层次存储器,以最优的控制调度算法和合理的成本,构成具有性能可接受的存储系统。 2.什么是高速缓冲存储器 答:指存取速度比一般随机存取记忆体(RAM)来得快的一种RAM。 一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成,容量比较小但速度比主存高得多,接近于CPU的速度。 在计算机存储系统的层次结构中,是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 3.假设一台模型计算机共有10种不同的操作码,如果采用固定长操作码需要4 位。已知各种操作码在程序中出现的概率如下表所示,计算采用Huffman编码 法的操作码平均长度,并计算固定长操作码和Huffman操作码的信息冗余量 (假设最短平均长度H=3.1位)。 答:构造Huffman树如下:

Huffman 编码的平均码长为: ∑=10 1 i i i l p =0.17*2+(0.15+0.15+0.13+0.12)*3+(0.09+0.08+0.07)*4+(0.03+0.01)*5=3.15 冗余量=(3.15-3.10)/3.15=1.59% 固定码长=log210=4 冗余量=(4-3.10)/4=22.5% 4.若某机要求有:三地址指令4条,单地址指令192条,零地址指令16条。设指令字长为12位,每个地址码长3位。问能否以扩展操作码为其编码? 答:三种指令字格式如下:

计算机体系结构名词解释总汇

集中式共享存储器结构(centralized shared memory architecture):这类多处理机在目前至多有几十个处理器,可通过大容量的cache和总线互连使各处理器共享一个单独的集中式存储器。 物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址,每个处理器可以访问任何一个其他的局部存储器。这类机器的结构被称为分布式共享存储器(DSM,distributed shared memory)或可缩放共享存储器(SSM,scalable shared memory)体系结构。 整个地址空间由多个独立的地址空间构成,它们在逻辑上也是独立的,远程的处理器不能对其直接寻址。在这种机器的不同处理器中,相同的物理地址指向不同存储器的不同单元,每一个处理器、存储器模块实际上是一个单独的计算机,因而这种机器也称为多计算机(multicomputers)。 通讯延迟:发送开销+跨越时间+传输延迟+接收开销。 迁移是把远程的共享数据项的拷贝放在一个本处理器局部的cache中使用,从而可降低对远程共享数据的访问延迟。 复制是把多个处理器需要同时读取的共享数据项的拷贝放在各自局部cache中使用,复制不仅降低了访存的延迟,也减少了访问共享数据时的产生的冲突。 目录(directory):物理存储器中用来保存共享数据块的状态及相关信息的数据结构。 监听(snooping):每个cache除了包含物理存储器中块的数据拷贝外,也保存着各个块的共享状态信息。Cache通常连在共享存储器的总线上,各个cache控制器通过监听总线来判断它们是否有总线请求的数据块。 在一个处理器写某个数据项之前保证它对此数据项有唯一的访问权,对应这种方法的协议称为写作废(write invalidate)协议。cache块拥有唯一的拷贝的处理器通常称为这个cache 块的拥有者(ower)。处理器的写操作使其成为对应cache块的拥有者。 原子性(atomic),即操作运行过程中不能被打断,例如将写失效的检测、申请总线连接、接收响应作为一个单独的原子操作。基于目录的相关性协议称为全映射(full map)。 原子交换(atomic change):将一个存储单元的值和一个寄存器的值进行交换。建立一个锁,锁值为0表示开锁,为1表示上锁。 旋转锁是指处理器环绕一个锁不停地旋转而试图获得该锁。 栅栏(barrier)同步:是一个同步操作,它强制所有到达该栅栏的进程进行等待,直到全部的进程到达栅栏,然后释放全部的进程,从而形成同步。 组合树是多个请求在局部结合起来形成树的一种分级结构,它降低冲突的原因是将大冲突化解成为并行的多个小冲突。排队记录等待的进程,当锁释放时送出一个已确定的等待进程,这种机制称为排队锁(queuing lock)。一个处理器对变量的写和另一个处理器对该变量的访问(读或写)由一对同步操作分开,其中一个在写操作后执行,另一个在别的处理机访问之前执行,则称数据访问有序。 无同步操作排序变量可能提前被刷新,这种情况称为数据竞争(data race),从而对于同步的程序可称之为无数据竞争(data-race-free)。 称与解锁相对应的同步操作为释放(release)与加锁相对应的则称为获取(acquire)。防护(fence)是计算过程中的固定点,用来保证无读或写穿过防护点。预取能返回最新数据值,并且保证对数据实际的存储器访问返回的是最新的数据项,则被称为非绑定的(nonbinding)。 互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络,这些结点可能是处理器、存储模块或其它设备,它们通过互连网络进行信息交换。静态网络由点和点直接相连而成,这种连接方式在程序执行过程中不会改变。 动态网络是用开关通道实现的,它可动态地改变结构,使其与用户程序中通信要求匹配。

《计算机系统结构》课程教学大纲

《计算机系统结构》课程教学大纲 一、课程基本信息 课程代码: 课程名称:计算机系统结构 英文名称:Computer Architecture 课程类别: 专业课 学时:72(其中实验18学时) 学分: 3.5 适用对象: 计算机科学与技术、网络工程专业 考核方式:考试(其中平时成绩占30%,期末考试成绩占70%) 先修课程:计算机组成原理、操作系统 二、课程简介 本课程是计算机专业一门重要的专业基础课,对于培养学生的抽象思维能力和自顶向下、系统地分析和解决问题的能力有非常重要的作用。其目标是使学生掌握计算机系统结构的基本概念、基本原理、基本结构、基本设计和分析方法,并对计算机系统结构的发展历史和现状有所了解。通过学习本课程,能把在“计算机组成原理”等课程中所学的软、硬件知识有机地结合起来,从而建立起计算机系统的完整概念。 This course is a computer professional important foundation for the professional class, for training students in abstract thinking, and top-down, System analysis and the ability to solve problems is a very important role. The goal is to enable students to master computer system structure the basic concepts, basic principles and basic structure, basic design and analysis methods and computer system architecture and the history of the development of an understanding of the status quo. Through the study of this course, can in "Principles of Computer Organization", y the school curriculum of the software and hardware knowledge combined organic, Computer systems in order to establish the integrity of the concept. 三、课程性质与教学目的 《计算机系统结构》的教学对象为计算机相关专业的高年级本科生专业技术基础课程,目的是介绍计算机体系结构的概念、技术和最新动态,着重介绍软,硬件功能分配以及如何最佳、最合理地实现软、硬件功能分配。要求了解基本概念、基本原理、基本结构和基本分析方法。使学生对计算机系统结构、组成和实现有一个整体掌握。 四、教学内容及要求 第一单元计算机系统结构的基本概念

相关主题