计算机系统结构导论课件.ppt

上传人:石*** 文档编号:87178352 上传时间:2023-04-16 格式:PPT 页数:41 大小:1.76MB
返回 下载 相关 举报
计算机系统结构导论课件.ppt_第1页
第1页 / 共41页
计算机系统结构导论课件.ppt_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《计算机系统结构导论课件.ppt》由会员分享,可在线阅读,更多相关《计算机系统结构导论课件.ppt(41页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、计算机系统结构导论计算机系统结构导论第1页,此课件共41页哦目目 录录第第1章章 计算机系统结构导论计算机系统结构导论1.1 计算机系统结构的基本概念1.2 计算机性能评测基础1.3 并行计算机的发展第2页,此课件共41页哦 第第1章章 计算机系统结构导论计算机系统结构导论第3页,此课件共41页哦1.1 计算机系统结构的基本概念计算机系统结构的基本概念计算机系统性能的不断提高主要靠器件的计算机系统性能的不断提高主要靠器件的变革和计算机系统结构的改进。变革和计算机系统结构的改进。计算机换代的标志:计算机换代的标志:计算机换代的标志:计算机换代的标志:计算机的器件计算机的器件计算机系统的结构计算机

2、系统的结构 推动计算机系统结构发展的关键是提高计算机推动计算机系统结构发展的关键是提高计算机系统的系统的并行性并行性第4页,此课件共41页哦1.1.1 计算机系统的层次结构计算机系统的层次结构 从计算机语言的角度,可将通用计算机系从计算机语言的角度,可将通用计算机系统划分成多级层次结构,每一层以一种不同的统划分成多级层次结构,每一层以一种不同的语言为特征。语言为特征。微程序机器级微程序机器级微程序机器级微程序机器级传统机器语言机器级传统机器语言机器级传统机器语言机器级传统机器语言机器级操作系统机器级操作系统机器级操作系统机器级操作系统机器级汇编语言机器级汇编语言机器级汇编语言机器级汇编语言机器

3、级高级语言机器级高级语言机器级高级语言机器级高级语言机器级应用语言机器级应用语言机器级应用语言机器级应用语言机器级 按由低层到高层的顺序,各层分别是:按由低层到高层的顺序,各层分别是:第5页,此课件共41页哦1.1.1 计算机系统的层次结构计算机系统的层次结构 从计算机语言的角度,可将通用计算机系从计算机语言的角度,可将通用计算机系统划分成多级层次结构,每一层以一种不同的统划分成多级层次结构,每一层以一种不同的语言为特征。语言为特征。微程序机器级微程序机器级微程序机器级微程序机器级传统机器语言机器级传统机器语言机器级传统机器语言机器级传统机器语言机器级操作系统机器级操作系统机器级操作系统机器级

4、操作系统机器级汇编语言机器级汇编语言机器级汇编语言机器级汇编语言机器级高级语言机器级高级语言机器级高级语言机器级高级语言机器级应用语言机器级应用语言机器级应用语言机器级应用语言机器级 按由低层到高层的顺序,各层分别是:按由低层到高层的顺序,各层分别是:第6页,此课件共41页哦中央处理机机器程序机器指令系统第2级机器语言计算机微程序控制寄存器传送门机器指令时序第1级微程序控制硬联逻辑逻辑线路内核硬操作时序第0级硬联逻辑硬件维护员硬件维护员 设计员设计员逻辑设计员逻辑设计员机器语言机器语言 程序员程序员实现机器指实现机器指定功能的中定功能的中央控制部分央控制部分传统机器语言传统机器语言机器级机器级

5、 第7页,此课件共41页哦应用程序信息处理系统应用语言第6级应用程序解释程序编译程序运行程序高级语言第5级高级语言计算机汇编程序运行程序汇编语言第4级汇编语言计算机操作系统系统资源键盘命令系统原语第3级操作系统操作员操作员汇编语言汇编语言 程序员程序员高级语言高级语言 程序员程序员用户用户操作系统机器级操作系统机器级汇编语言机器级汇编语言机器级高级语言机器级高级语言机器级应用语言机器级应用语言机器级第8页,此课件共41页哦1.低层机器级对高层机器级的支持低层机器级对高层机器级的支持 各层机器级语言的功能是依靠下一层机器级的支持才各层机器级语言的功能是依靠下一层机器级的支持才各层机器级语言的功能

6、是依靠下一层机器级的支持才各层机器级语言的功能是依靠下一层机器级的支持才能实现的,而且,这种支持要满足透明性要求。能实现的,而且,这种支持要满足透明性要求。能实现的,而且,这种支持要满足透明性要求。能实现的,而且,这种支持要满足透明性要求。透明性:透明性:从计算机系统的某一层的使用者角度看,只需通过从计算机系统的某一层的使用者角度看,只需通过从计算机系统的某一层的使用者角度看,只需通过从计算机系统的某一层的使用者角度看,只需通过该层的语言就可以使用机器,而不必关心其下层的机器该层的语言就可以使用机器,而不必关心其下层的机器该层的语言就可以使用机器,而不必关心其下层的机器该层的语言就可以使用机器

7、,而不必关心其下层的机器级是如何工作和如何实现对上层的支持的。级是如何工作和如何实现对上层的支持的。级是如何工作和如何实现对上层的支持的。级是如何工作和如何实现对上层的支持的。计算机系统的计算机系统的计算机系统的计算机系统的“透明透明透明透明”是看不到的意思,即对某一是看不到的意思,即对某一是看不到的意思,即对某一是看不到的意思,即对某一层的使用者来说,他看不到该层以下各层的机器属性。层的使用者来说,他看不到该层以下各层的机器属性。层的使用者来说,他看不到该层以下各层的机器属性。层的使用者来说,他看不到该层以下各层的机器属性。第9页,此课件共41页哦2.计算机系统结构、计算机组成与实现计算机系

8、统结构、计算机组成与实现 计算机系统结构:计算机系统结构:(Computer ArchitectureComputer Architecture)也称为计算机体系结构,经典的计算机)也称为计算机体系结构,经典的计算机)也称为计算机体系结构,经典的计算机)也称为计算机体系结构,经典的计算机系统结构的定义是指计算机系统多级层次结构中机器语言机器级的结构,它系统结构的定义是指计算机系统多级层次结构中机器语言机器级的结构,它系统结构的定义是指计算机系统多级层次结构中机器语言机器级的结构,它系统结构的定义是指计算机系统多级层次结构中机器语言机器级的结构,它是软件和硬件是软件和硬件是软件和硬件是软件和硬件

9、/固件的主要交界面,是由机器语言程序、汇编语言源程序固件的主要交界面,是由机器语言程序、汇编语言源程序固件的主要交界面,是由机器语言程序、汇编语言源程序固件的主要交界面,是由机器语言程序、汇编语言源程序和高级语言源程序翻译生成的机器语言目标程序能在机器上正确运行所和高级语言源程序翻译生成的机器语言目标程序能在机器上正确运行所和高级语言源程序翻译生成的机器语言目标程序能在机器上正确运行所和高级语言源程序翻译生成的机器语言目标程序能在机器上正确运行所应具有的界面结构和功能。应具有的界面结构和功能。应具有的界面结构和功能。应具有的界面结构和功能。计算机组成计算机组成:(Computer Organi

10、zationComputer Organization)是计算机系统结构的逻辑实现,它主要研)是计算机系统结构的逻辑实现,它主要研)是计算机系统结构的逻辑实现,它主要研)是计算机系统结构的逻辑实现,它主要研究硬件系统在逻辑上是如何组织的,机器级内部数据流和控制流的组成与逻辑究硬件系统在逻辑上是如何组织的,机器级内部数据流和控制流的组成与逻辑究硬件系统在逻辑上是如何组织的,机器级内部数据流和控制流的组成与逻辑究硬件系统在逻辑上是如何组织的,机器级内部数据流和控制流的组成与逻辑设计。计算机实现(设计。计算机实现(设计。计算机实现(设计。计算机实现(Computer ImplementationCo

11、mputer Implementation)是指计算机组成的物理)是指计算机组成的物理)是指计算机组成的物理)是指计算机组成的物理实现,主要着眼于器件技术和微组装技术。实现,主要着眼于器件技术和微组装技术。实现,主要着眼于器件技术和微组装技术。实现,主要着眼于器件技术和微组装技术。第10页,此课件共41页哦3.软件可移植性软件可移植性 在计算机系统结构的范畴内,实现软件可移植性的基在计算机系统结构的范畴内,实现软件可移植性的基在计算机系统结构的范畴内,实现软件可移植性的基在计算机系统结构的范畴内,实现软件可移植性的基本途径有:本途径有:本途径有:本途径有:统一高级语言统一高级语言统一高级语言统

12、一高级语言 采用系列机采用系列机采用系列机采用系列机 模拟和仿真等。模拟和仿真等。模拟和仿真等。模拟和仿真等。软件可移植性软件可移植性:(Software PortabilitySoftware Portability)是指在一台机器上编制的软件不用修改或只经少)是指在一台机器上编制的软件不用修改或只经少)是指在一台机器上编制的软件不用修改或只经少)是指在一台机器上编制的软件不用修改或只经少量修改就可在另一台机器上运行,使得同一个软件可以应用于不同的硬件环境中。量修改就可在另一台机器上运行,使得同一个软件可以应用于不同的硬件环境中。量修改就可在另一台机器上运行,使得同一个软件可以应用于不同的硬

13、件环境中。量修改就可在另一台机器上运行,使得同一个软件可以应用于不同的硬件环境中。第11页,此课件共41页哦系列机:系列机:具有相同的系统结构,但具有不同组成和实现技术的一系列具有相同的系统结构,但具有不同组成和实现技术的一系列具有相同的系统结构,但具有不同组成和实现技术的一系列具有相同的系统结构,但具有不同组成和实现技术的一系列不同型号的机器。不同型号的机器。不同型号的机器。不同型号的机器。软件兼容软件兼容:是指同一个软件可以不加修改地运行于结构相同的各档是指同一个软件可以不加修改地运行于结构相同的各档是指同一个软件可以不加修改地运行于结构相同的各档是指同一个软件可以不加修改地运行于结构相同

14、的各档机器上,而且运行结果一致。机器上,而且运行结果一致。机器上,而且运行结果一致。机器上,而且运行结果一致。系列机技术既可以使同一系列的机器在汇编语言上实现统一,又能系列机技术既可以使同一系列的机器在汇编语言上实现统一,又能系列机技术既可以使同一系列的机器在汇编语言上实现统一,又能系列机技术既可以使同一系列的机器在汇编语言上实现统一,又能在同一系列内开发出性能价格比更高的新机器。因此,在结构相同或相近的在同一系列内开发出性能价格比更高的新机器。因此,在结构相同或相近的在同一系列内开发出性能价格比更高的新机器。因此,在结构相同或相近的在同一系列内开发出性能价格比更高的新机器。因此,在结构相同或

15、相近的机器之间能实现汇编语言应用软件和部分系统软件的移植。机器之间能实现汇编语言应用软件和部分系统软件的移植。机器之间能实现汇编语言应用软件和部分系统软件的移植。机器之间能实现汇编语言应用软件和部分系统软件的移植。向上(下)兼容是指在某档机器上编制的程序可不加修改地运行向上(下)兼容是指在某档机器上编制的程序可不加修改地运行向上(下)兼容是指在某档机器上编制的程序可不加修改地运行向上(下)兼容是指在某档机器上编制的程序可不加修改地运行于比它高(低)档的机器上;于比它高(低)档的机器上;于比它高(低)档的机器上;于比它高(低)档的机器上;向前(后)兼容是指在某型号机器上编制的程序可不加修改向前(

16、后)兼容是指在某型号机器上编制的程序可不加修改向前(后)兼容是指在某型号机器上编制的程序可不加修改向前(后)兼容是指在某型号机器上编制的程序可不加修改地运行于在它之前(后)投入市场的机器上。地运行于在它之前(后)投入市场的机器上。地运行于在它之前(后)投入市场的机器上。地运行于在它之前(后)投入市场的机器上。对于系列机必须保证做到向后兼容,力争做到向上兼容。对于系列机必须保证做到向后兼容,力争做到向上兼容。对于系列机必须保证做到向后兼容,力争做到向上兼容。对于系列机必须保证做到向后兼容,力争做到向上兼容。第12页,此课件共41页哦1.1.2 计算机系统并行性的基本概念计算机系统并行性的基本概念

17、 并行性并行性:是指同一时刻或同一时间间隔内发生两种或两种以是指同一时刻或同一时间间隔内发生两种或两种以是指同一时刻或同一时间间隔内发生两种或两种以是指同一时刻或同一时间间隔内发生两种或两种以上性质相同或不相同的事件。上性质相同或不相同的事件。上性质相同或不相同的事件。上性质相同或不相同的事件。同时性同时性:是指两个或多个事件在同一时间间隔内发生。是指两个或多个事件在同一时间间隔内发生。是指两个或多个事件在同一时间间隔内发生。是指两个或多个事件在同一时间间隔内发生。并发性并发性:是指两个或多个事件在同一时刻发生。是指两个或多个事件在同一时刻发生。是指两个或多个事件在同一时刻发生。是指两个或多个

18、事件在同一时刻发生。第13页,此课件共41页哦1.发展计算机系统并行性的技术途径发展计算机系统并行性的技术途径 可以通过可以通过3 3类技术途径来提高计算机系统的并行性,类技术途径来提高计算机系统的并行性,类技术途径来提高计算机系统的并行性,类技术途径来提高计算机系统的并行性,这就是时间重叠、资源重复和资源共享。这就是时间重叠、资源重复和资源共享。这就是时间重叠、资源重复和资源共享。这就是时间重叠、资源重复和资源共享。时间重叠时间重叠时间重叠时间重叠是在并行性概念中引入时间因素,让多个处理过是在并行性概念中引入时间因素,让多个处理过是在并行性概念中引入时间因素,让多个处理过是在并行性概念中引入

19、时间因素,让多个处理过程在处理时间上错开,轮流重叠地使用同一套硬件设备的各个程在处理时间上错开,轮流重叠地使用同一套硬件设备的各个程在处理时间上错开,轮流重叠地使用同一套硬件设备的各个程在处理时间上错开,轮流重叠地使用同一套硬件设备的各个部件,提高多个处理过程的并发性。部件,提高多个处理过程的并发性。部件,提高多个处理过程的并发性。部件,提高多个处理过程的并发性。资源重复资源重复资源重复资源重复是在并行性概念中引入空间因素,通过重复设是在并行性概念中引入空间因素,通过重复设是在并行性概念中引入空间因素,通过重复设是在并行性概念中引入空间因素,通过重复设置硬件资源分别同时用于多个处理过程,实现多

20、个处理过程置硬件资源分别同时用于多个处理过程,实现多个处理过程置硬件资源分别同时用于多个处理过程,实现多个处理过程置硬件资源分别同时用于多个处理过程,实现多个处理过程的同时性。的同时性。的同时性。的同时性。资源共享资源共享资源共享资源共享是利用软件方法让多个任务按一定顺序轮流使是利用软件方法让多个任务按一定顺序轮流使是利用软件方法让多个任务按一定顺序轮流使是利用软件方法让多个任务按一定顺序轮流使用一套资源,通过提高系统资源利用率来提高系统的性能和用一套资源,通过提高系统资源利用率来提高系统的性能和用一套资源,通过提高系统资源利用率来提高系统的性能和用一套资源,通过提高系统资源利用率来提高系统的

21、性能和效率。效率。效率。效率。第14页,此课件共41页哦2.并行性等级并行性等级 (分以下两种情况分以下两种情况分以下两种情况分以下两种情况,每种情况四级每种情况四级每种情况四级每种情况四级)(1)按计算机系统中执行程序的并行性划分)按计算机系统中执行程序的并行性划分)按计算机系统中执行程序的并行性划分)按计算机系统中执行程序的并行性划分 指令内部并行指令内部并行指令内部并行指令内部并行 指令之间并行指令之间并行指令之间并行指令之间并行 任务或进程之间并行任务或进程之间并行任务或进程之间并行任务或进程之间并行 作业或程序之间并行作业或程序之间并行作业或程序之间并行作业或程序之间并行(2)按计算

22、机信息加工的并行性划分)按计算机信息加工的并行性划分)按计算机信息加工的并行性划分)按计算机信息加工的并行性划分 存储器操作并行存储器操作并行存储器操作并行存储器操作并行 处理器操作步骤并行处理器操作步骤并行 处理器操作并行处理器操作并行 指令、任务、作业并行指令、任务、作业并行指令、任务、作业并行指令、任务、作业并行第15页,此课件共41页哦3.计算机系统结构的分类计算机系统结构的分类 指令流指令流:是指机器执行的指令序列。是指机器执行的指令序列。是指机器执行的指令序列。是指机器执行的指令序列。数据流数据流:是指由指令流调用的数据序列,包括输入数据和中间结果。是指由指令流调用的数据序列,包括

23、输入数据和中间结果。是指由指令流调用的数据序列,包括输入数据和中间结果。是指由指令流调用的数据序列,包括输入数据和中间结果。多倍性多倍性:是指在系统最受限制的部件上,同时处于同一执行阶是指在系统最受限制的部件上,同时处于同一执行阶是指在系统最受限制的部件上,同时处于同一执行阶是指在系统最受限制的部件上,同时处于同一执行阶段的指令或数据的最大可能个数。段的指令或数据的最大可能个数。段的指令或数据的最大可能个数。段的指令或数据的最大可能个数。FlynnFlynn按指令流和数据流的多倍性对计算机系统结构进行分类按指令流和数据流的多倍性对计算机系统结构进行分类按指令流和数据流的多倍性对计算机系统结构进

24、行分类按指令流和数据流的多倍性对计算机系统结构进行分类:单指令流单数据流(单指令流单数据流(单指令流单数据流(单指令流单数据流(SISDSISD)体系结构)体系结构)体系结构)体系结构 单指令流多数据流(单指令流多数据流(单指令流多数据流(单指令流多数据流(SIMDSIMD)体系结构)体系结构)体系结构)体系结构 多指令流单数据流(多指令流单数据流(多指令流单数据流(多指令流单数据流(MISDMISD)体系结构)体系结构)体系结构)体系结构 多指令流多数据流(多指令流多数据流(多指令流多数据流(多指令流多数据流(MIMDMIMD)体系结构)体系结构)体系结构)体系结构 第16页,此课件共41页

25、哦CUCU:控制部件:控制部件:控制部件:控制部件 PUPU:处理部件:处理部件:处理部件:处理部件 MMMM:存储器模块:存储器模块:存储器模块:存储器模块 ISIS:指令流:指令流:指令流:指令流 DSDS:数据流:数据流:数据流:数据流图图图图1.4 Flynn1.4 Flynn分类法各类机器结构分类法各类机器结构分类法各类机器结构分类法各类机器结构 第17页,此课件共41页哦1.2 计算机性能评测基础计算机性能评测基础计算机性能计算机性能:通常是指计算机的工作速度,它是程序执行通常是指计算机的工作速度,它是程序执行通常是指计算机的工作速度,它是程序执行通常是指计算机的工作速度,它是程序

26、执行时间的倒数。时间的倒数。时间的倒数。时间的倒数。计算机的性能不仅与计算机的系统结构有关,而且与程计算机的性能不仅与计算机的系统结构有关,而且与程计算机的性能不仅与计算机的系统结构有关,而且与程计算机的性能不仅与计算机的系统结构有关,而且与程序和算法有关。序和算法有关。序和算法有关。序和算法有关。第18页,此课件共41页哦1.2.1 计算机性能评测的作用与分级计算机性能评测的作用与分级1.性能评测的作用性能评测的作用(1)改进体系结构设计,提高机器的)改进体系结构设计,提高机器的性能性能(2)促进软)促进软/硬件结合,合理功能划分硬件结合,合理功能划分(3)优化)优化“结构结构算法算法应用应

27、用”的最佳组的最佳组合合(4)提高高性能计算机的使用效率)提高高性能计算机的使用效率 第19页,此课件共41页哦2.性能评测的分级性能评测的分级 计算机性能的评测可以划分为机器级、算法级和程计算机性能的评测可以划分为机器级、算法级和程序级序级3 3个层次。个层次。个层次。个层次。机器级的性能评测机器级的性能评测机器级的性能评测机器级的性能评测主要包括:主要包括:主要包括:主要包括:CPUCPU的基本性能指标;存储器的基本的基本性能指标;存储器的基本的基本性能指标;存储器的基本的基本性能指标;存储器的基本性能指标;并行计算机的并行计算与通信的开销;并行计算机的可用性性能指标;并行计算机的并行计算

28、与通信的开销;并行计算机的可用性性能指标;并行计算机的并行计算与通信的开销;并行计算机的可用性性能指标;并行计算机的并行计算与通信的开销;并行计算机的可用性和好用性以及机器成本、价格与性能和好用性以及机器成本、价格与性能和好用性以及机器成本、价格与性能和好用性以及机器成本、价格与性能/价格比等。价格比等。价格比等。价格比等。算法级的性能评测算法级的性能评测算法级的性能评测算法级的性能评测主要是为了评价算法的性能。在并行计算机上进主要是为了评价算法的性能。在并行计算机上进主要是为了评价算法的性能。在并行计算机上进主要是为了评价算法的性能。在并行计算机上进行计算的主要目的是要加速整个计算过程,其中

29、,并行算法的加速性能是行计算的主要目的是要加速整个计算过程,其中,并行算法的加速性能是行计算的主要目的是要加速整个计算过程,其中,并行算法的加速性能是行计算的主要目的是要加速整个计算过程,其中,并行算法的加速性能是最关键的因素,它体现了对于一个给定的应用,并行算法相对于串行算法最关键的因素,它体现了对于一个给定的应用,并行算法相对于串行算法最关键的因素,它体现了对于一个给定的应用,并行算法相对于串行算法最关键的因素,它体现了对于一个给定的应用,并行算法相对于串行算法的执行速度加快了多少倍。的执行速度加快了多少倍。的执行速度加快了多少倍。的执行速度加快了多少倍。程序级的性能评测程序级的性能评测程

30、序级的性能评测程序级的性能评测主要使用一组基准测试程序测试和评价计算机主要使用一组基准测试程序测试和评价计算机主要使用一组基准测试程序测试和评价计算机主要使用一组基准测试程序测试和评价计算机系统的各种性能。系统的各种性能。系统的各种性能。系统的各种性能。(1.(1.真实程序评测真实程序评测真实程序评测真实程序评测;2.;2.核心程序评测核心程序评测核心程序评测核心程序评测;3.;3.小测试程序小测试程序小测试程序小测试程序;4.;4.综合测试程序综合测试程序综合测试程序综合测试程序;5.;5.测试程序组测试程序组测试程序组测试程序组件件件件 ).1111页页页页第20页,此课件共41页哦1.2

31、.2 计算机的基本性能指标计算机的基本性能指标 1.单单CPU性能性能 一个程序在计算机上运行,花费的一个程序在计算机上运行,花费的CPUCPU时间为时间为时间为时间为CPU的时钟周期与该程序所有机器指令使用的时钟周期与该程序所有机器指令使用的时钟周期与该程序所有机器指令使用的时钟周期与该程序所有机器指令使用CPUCPU的的的的时钟周期数的乘积,即时钟周期数的乘积,即时钟周期数的乘积,即时钟周期数的乘积,即 CPUCPU时间时间时间时间 =CPU=CPU时钟周期数时钟周期数时钟周期数时钟周期数 时钟周期时钟周期时钟周期时钟周期 CPUCPU时间时间时间时间 =CPU=CPU时钟周期数时钟周期数

32、时钟周期数时钟周期数 /时钟频率时钟频率 若程序使用的指令条数用若程序使用的指令条数用若程序使用的指令条数用若程序使用的指令条数用ICIC表示,那么,指令的平表示,那么,指令的平表示,那么,指令的平表示,那么,指令的平均时钟周期数均时钟周期数均时钟周期数均时钟周期数CPI为为为为 或或或或CPI CPI=CPU=CPU时钟周期数时钟周期数时钟周期数时钟周期数 /I/IC C第21页,此课件共41页哦可重写可重写可重写可重写CPUCPU时间表达式为时间表达式为时间表达式为时间表达式为 CPUCPU时间时间时间时间 =(=(IC CPI)/)/时钟频率时钟频率时钟频率时钟频率上式表明,上式表明,上

33、式表明,上式表明,CPUCPU的性能取决于的性能取决于的性能取决于的性能取决于3个因素:个因素:个因素:个因素:时钟频率,时钟频率取决于硬件技术和组织。时钟频率,时钟频率取决于硬件技术和组织。机器指令的平均时钟周期数机器指令的平均时钟周期数机器指令的平均时钟周期数机器指令的平均时钟周期数CPICPI,CPI CPI 取决于取决于系统结构及其指令集的设计与实现。系统结构及其指令集的设计与实现。程序使用的指令条数程序使用的指令条数程序使用的指令条数程序使用的指令条数ICIC,ICIC取决于系统结构的取决于系统结构的取决于系统结构的取决于系统结构的指令集和编译技术。指令集和编译技术。指令集和编译技术

34、。指令集和编译技术。第22页,此课件共41页哦 若指令若指令若指令若指令 i i 在程序中执行的次数为在程序中执行的次数为在程序中执行的次数为在程序中执行的次数为I Ii i,指令,指令,指令,指令 i i 所需的所需的时钟周期数为时钟周期数为CPICPIi i,那么,指令的平均时钟周期数,那么,指令的平均时钟周期数,那么,指令的平均时钟周期数,那么,指令的平均时钟周期数 CPI 为为为为 其中,其中,其中,其中,I Ii i/ICIC表示指令表示指令表示指令表示指令i i在程序所使用的指令条在程序所使用的指令条数中所占的比例,称为指令数中所占的比例,称为指令 i i 的的的的使用频度使用频度

35、使用频度使用频度。第23页,此课件共41页哦2.加速比加速比 Amdahl Amdahl定律定律定律定律用加速比来衡量改进措施对系统性能用加速比来衡量改进措施对系统性能用加速比来衡量改进措施对系统性能用加速比来衡量改进措施对系统性能提高的程度。提高的程度。提高的程度。提高的程度。加速比加速比S S的定义为的定义为的定义为的定义为 S=T0 0/T/T 其中,其中,T T0 0为没有采用改进措施前的执行时间,为没有采用改进措施前的执行时间,为没有采用改进措施前的执行时间,为没有采用改进措施前的执行时间,T T为采用改进措施后的执行时间。为采用改进措施后的执行时间。第24页,此课件共41页哦若若F

36、 Fe e表示改进前可被改进部分的执行时间相对表示改进前可被改进部分的执行时间相对T T0 0的百分比,那么,的百分比,那么,改进前不被改进部分的执行时间相对改进前不被改进部分的执行时间相对T T0 0的百分比为的百分比为1-1-F Fe e。另外,用。另外,用S Se e表示可被改进部分改进前执行时间对改进后执行时间的比值,即表示可被改进部分改进前执行时间对改进后执行时间的比值,即被改进部分改进后的速度提高倍数。可以用被改进部分改进后的速度提高倍数。可以用F Fe e和和S Se e表示表示T Tn n为为 T Tn n=T T0 0(1-F Fe)+)+T T0 0F Fe/S Se e=

37、T T0 0(1-(1-F Fe+F Fe/S Se e)可得改进后整个系统的加速比可得改进后整个系统的加速比S Sn n为为 由于由于00F Fe e11,S Se e11,故,故S Sn n11。可见性能的提高幅度受改进。可见性能的提高幅度受改进部分所占比例部分所占比例F Fe e的限制。即使改进部分的改进效果非常好,有的限制。即使改进部分的改进效果非常好,有S Se e,可得,可得S Sn n=1/(1-=1/(1-F Fe e),整个系统的性能提高的程序受,整个系统的性能提高的程序受F Fe e的限制。的限制。第25页,此课件共41页哦 【例例1.3】如果如果FP指令的比例为指令的比例

38、为25%,其,其中,中,FPSQR占全部指令的比例为占全部指令的比例为2%,FP操作操作的的CPI为为4,FPSQR操作的操作的CPI为为20,其他指,其他指令的平均令的平均CPI为为1.33。现有两种改进方案,一。现有两种改进方案,一种是把种是把FPSQR操作的操作的CPI减至减至2,另一种是把,另一种是把所有的所有的FP操作的操作的CPI减至减至2,试比较两种方案,试比较两种方案对系统性能的提高程度。对系统性能的提高程度。第26页,此课件共41页哦解:解:没有改进之前,系统的指令平均时钟周期没有改进之前,系统的指令平均时钟周期CPICPI为为为为 采用方案采用方案A,如果使,如果使,如果使

39、,如果使FPSQRFPSQR操作的时钟周期数由操作的时钟周期数由操作的时钟周期数由操作的时钟周期数由CPICPIFPSQR=20=20降至降至降至降至 ,那么,整个系统的指令平,那么,整个系统的指令平,那么,整个系统的指令平,那么,整个系统的指令平均时钟周期数为均时钟周期数为均时钟周期数为均时钟周期数为 第27页,此课件共41页哦 采用方案采用方案采用方案采用方案B B,如果使所有,如果使所有,如果使所有,如果使所有FPFP操作的平均时钟周期操作的平均时钟周期操作的平均时钟周期操作的平均时钟周期数由数由数由数由CPIFP=4降至降至降至降至 ,那么,整个系统的指令,那么,整个系统的指令,那么,

40、整个系统的指令,那么,整个系统的指令平均时钟周期数为平均时钟周期数为平均时钟周期数为平均时钟周期数为 第28页,此课件共41页哦 从降低整个系统的指令平均时钟周期数的程度来看,从降低整个系统的指令平均时钟周期数的程度来看,从降低整个系统的指令平均时钟周期数的程度来看,从降低整个系统的指令平均时钟周期数的程度来看,方案方案方案方案B B优于方案优于方案优于方案优于方案A A。分别计算两种方案的加速比分别计算两种方案的加速比分别计算两种方案的加速比分别计算两种方案的加速比 同样可计算出方案同样可计算出方案B的加速比的加速比的加速比的加速比S SB B=CPI CPI/CPICPIB B=2/=2/

41、1.5=1.331.5=1.33。从加速比来看,也可得出方案。从加速比来看,也可得出方案。从加速比来看,也可得出方案。从加速比来看,也可得出方案B B优于方案优于方案优于方案优于方案A A的的结论。结论。第29页,此课件共41页哦3.MIPS和和MFLOPSMIPS:表示每秒百万指令条数。对于一个给定的程表示每秒百万指令条数。对于一个给定的程表示每秒百万指令条数。对于一个给定的程表示每秒百万指令条数。对于一个给定的程序,序,序,序,MIPSMIPS定义为定义为定义为定义为 程序的执行时间为程序的执行时间为程序的执行时间为程序的执行时间为第30页,此课件共41页哦MFLOPS:表示每秒百万浮点操

42、作次数。表示每秒百万浮点操作次数。MFLOPS定义为定义为 第31页,此课件共41页哦4.基准测试程序的执行时间基准测试程序的执行时间基准测试程序:基准测试程序:是为测试比较机器性能而专门编制的程序,它考虑是为测试比较机器性能而专门编制的程序,它考虑是为测试比较机器性能而专门编制的程序,它考虑是为测试比较机器性能而专门编制的程序,它考虑了各种操作和各种程序的比较。了各种操作和各种程序的比较。了各种操作和各种程序的比较。了各种操作和各种程序的比较。将将将将n n个测试程序在机器上运行,记录它们的执行时个测试程序在机器上运行,记录它们的执行时间,可按下述几种方法对间,可按下述几种方法对n个执行时间

43、进行处理之后个执行时间进行处理之后来评价机器性能。来评价机器性能。(1)平均执行时间)平均执行时间:是各测试程序执行时间的算术平均值。是各测试程序执行时间的算术平均值。是各测试程序执行时间的算术平均值。是各测试程序执行时间的算术平均值。其中,其中,其中,其中,T Ti i 为第为第为第为第 i i 个测试程序的执行时间。个测试程序的执行时间。个测试程序的执行时间。个测试程序的执行时间。第32页,此课件共41页哦(2)加权执行时间)加权执行时间:是各测试程序执行时间的加权平均值。是各测试程序执行时间的加权平均值。是各测试程序执行时间的加权平均值。是各测试程序执行时间的加权平均值。其中,权因子其中

44、,权因子 WWi 是第是第是第是第 i i 个测试程序在总共个测试程序在总共 n n 个测试程序中所占的比重个测试程序中所占的比重第33页,此课件共41页哦指令指令指令指令类类类类型型型型指令条数指令条数指令条数指令条数平均平均平均平均时钟时钟时钟时钟周期数周期数周期数周期数整数运算整数运算整数运算整数运算45 00045 0001 1数据数据数据数据传传传传送送送送32 00032 0002 2浮点运算浮点运算浮点运算浮点运算15 00015 0002 2控制控制控制控制传传传传送送送送800080002 2求测试程序的求测试程序的求测试程序的求测试程序的CPI、MIPSMIPS和执行时间。

45、和执行时间。和执行时间。和执行时间。第34页,此课件共41页哦解:解:解:解:测试程序的指令条数测试程序的指令条数测试程序的指令条数测试程序的指令条数 测试程序的指令平均时钟周期数测试程序的指令平均时钟周期数测试程序的指令平均时钟周期数测试程序的指令平均时钟周期数第35页,此课件共41页哦 测试程序在处理机上用每秒百万指令条数表示的测试程序在处理机上用每秒百万指令条数表示的测试程序在处理机上用每秒百万指令条数表示的测试程序在处理机上用每秒百万指令条数表示的执行速率为执行速率为执行速率为执行速率为 测试程序在处理机上执行的时间测试程序在处理机上执行的时间测试程序在处理机上执行的时间测试程序在处理

46、机上执行的时间 第36页,此课件共41页哦1.3 并行计算机的发展并行计算机的发展并行计算机并行计算机:是由多个处理单元或处理器组成的计算机系统,这是由多个处理单元或处理器组成的计算机系统,这是由多个处理单元或处理器组成的计算机系统,这是由多个处理单元或处理器组成的计算机系统,这些处理单元或处理器之间通过互连网络相互通信和协作,些处理单元或处理器之间通过互连网络相互通信和协作,些处理单元或处理器之间通过互连网络相互通信和协作,些处理单元或处理器之间通过互连网络相互通信和协作,能快速、高效地求解大型复杂问题。能快速、高效地求解大型复杂问题。能快速、高效地求解大型复杂问题。能快速、高效地求解大型复

47、杂问题。串行计算机串行计算机:(又称为顺序计算机)只有单个处理单元,按顺序工作(又称为顺序计算机)只有单个处理单元,按顺序工作(又称为顺序计算机)只有单个处理单元,按顺序工作(又称为顺序计算机)只有单个处理单元,按顺序工作方式逐一顺序地执行程序中的指令。方式逐一顺序地执行程序中的指令。方式逐一顺序地执行程序中的指令。方式逐一顺序地执行程序中的指令。当代的主流并行计算机是可扩放并行计算机,包括当代的主流并行计算机是可扩放并行计算机,包括 共享存储的对称多处理机共享存储的对称多处理机共享存储的对称多处理机共享存储的对称多处理机 分布存储的大规模并行处理机分布存储的大规模并行处理机分布存储的大规模并

48、行处理机分布存储的大规模并行处理机 分布式共享存储多处理机分布式共享存储多处理机分布式共享存储多处理机分布式共享存储多处理机 工作站机群工作站机群工作站机群工作站机群 网格计算环境网格计算环境网格计算环境网格计算环境第37页,此课件共41页哦1.3.1 支持并行计算机的技术进展支持并行计算机的技术进展1.硬件进展硬件进展(1 1)处理器)处理器)处理器)处理器 在单片上制造包括内存和在单片上制造包括内存和 I/O I/O 支持的较强功能支持的较强功能的计算机系统,即片上计算机系统;或者在单片上的计算机系统,即片上计算机系统;或者在单片上放置多个处理器,即单片并行结构。放置多个处理器,即单片并行

49、结构。(2 2)存储系统)存储系统)存储系统)存储系统 存储器工艺技术的进展远跟不上处理器的发展步伐。存储器工艺技术的进展远跟不上处理器的发展步伐。存储器工艺技术的进展远跟不上处理器的发展步伐。存储器工艺技术的进展远跟不上处理器的发展步伐。处理器和存储器性能改进的悬殊差异,迫使在近处理器和存储器性能改进的悬殊差异,迫使在近代计算机中的存储系统使用多级存储器的结构。代计算机中的存储系统使用多级存储器的结构。第38页,此课件共41页哦2.软件进展软件进展至今,并行软件的进展主要有以下表现:至今,并行软件的进展主要有以下表现:至今,并行软件的进展主要有以下表现:至今,并行软件的进展主要有以下表现:清

50、楚地明确并行软件的要求和关键问题。清楚地明确并行软件的要求和关键问题。清楚地明确并行软件的要求和关键问题。清楚地明确并行软件的要求和关键问题。并行软件的开发应坚持与结构无关的基本原则。并行软件的开发应坚持与结构无关的基本原则。并行软件的开发应坚持与结构无关的基本原则。并行软件的开发应坚持与结构无关的基本原则。应该开发公共使用的、开放的、标准的软件工具。应该开发公共使用的、开放的、标准的软件工具。应该开发公共使用的、开放的、标准的软件工具。应该开发公共使用的、开放的、标准的软件工具。在串行编程语言(如在串行编程语言(如在串行编程语言(如在串行编程语言(如FortranFortran或或或或C C

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com