收藏 分享(赏)

第一章 计算机系统设计基础.ppt

上传人:dzzj200808 文档编号:4052875 上传时间:2018-12-06 格式:PPT 页数:41 大小:253KB
下载 相关 举报
第一章 计算机系统设计基础.ppt_第1页
第1页 / 共41页
第一章 计算机系统设计基础.ppt_第2页
第2页 / 共41页
第一章 计算机系统设计基础.ppt_第3页
第3页 / 共41页
第一章 计算机系统设计基础.ppt_第4页
第4页 / 共41页
第一章 计算机系统设计基础.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

1、计算机系统结构 教 学 幻 灯 片适用09师范/非师/11高本各班 20112012学年 第2学期主讲教师:朱元辉,结构课件封,关于计算机系统结构这门课课程性质:必修专业课,考试课,占3学分选用教材 计算机系统结构高辉,石曙东等编 武大出版社 2006.8 授课学时:18354 ( 118周, 每周3 学时 )学习方法:教学为主- 循序渐进。自学为辅- 独立思考评分比例:平时占35%(包括作业、考勤及课堂表现)期末考试占65%(总分100分)作业次数:约 8 次,关于本课,:,第一章 计算机系统结构设计基础本章的主要阐述:系统结构基本概念和计算机发展史;系统设计技术;系统性能评估。本章学习目的

2、和要求:建立计算机系统结构的整体概念;要求掌握计算机系统层次模型。本章重点:系统层次结构模型,计算机性能指标,加速比Amdahl定律,程序访问局部性原理。本章难点:Amdahl定律。,第一章目录, 计算机系统结构主要研究软、硬件功能分配 (软硬件界面的确定), 即:哪些功能由软件完成?哪些由硬件完成?如何实现?因此,设计一个计算机系统就要对系统的效率、速度、价格、资源状况等进行综合考虑, 以确定对软件、硬件、固件的取舍, 从而最终组成系统结构。,基本概念,1.1 计算机系统结构的基本概念 (P2),原理上,软件实现的功能完全可以用硬件或固件完成,硬件实现的功能也可以由软件的模拟来完成,只是其性

3、能、价格实现的难易程度有所不同。,软件和硬件在逻辑功能上是等效的。,具有相同功能的计算机系统,其软、硬件功能分配比例可以在很宽的范围内变化。,111层次模型,1.1.1层次结构,应用语言级,高级语言级,汇编语言级,操作系统级,传统机器级,微程序机器级,硬联逻辑电路,翻译(应用程序包),翻译(编译),翻译(汇编),部分解释,解释(微程序),硬件直接执行,(操作系统),L5,L4,L3,L2,L1,L0,应用软件,系统软件,硬件,固件,Fig1.1 P3,1.1.2 系统结构,1.1.2 计算机系统结构(computer Architecture)*系统结构的定义: 此外特性指计算机系统的基本属性

4、:(传统机器级的系统结构) 计算机的概念性结构和功能结构, 即计算机系统中软件/硬件之间的界面。*系统结构术语解: ,透明性: 本来存在的事物, 从某个角度看似乎不存在,机器语言程序员(或编译程序编写者)看到的一个 计算机系统的外特性。(P2),属性 P4-5,计算机系统结构的属性应包括:1. 硬件能直接处理的数据类型, 格式等 2. 最小寻址单位, 寻址类型, 地址计算等3. 通用/专用寄存器的设置4. 指令系统5. 内存组织6. 中断系统7. 机器级管态 /用户态的定义和功能切换8. 机器级I /O结构9. 信息保护方式和保护机构,1.1.3 组成 P5,1.1.3 计算机组成与计算机实现

5、 组成 指计算机系统的逻辑实现, 包括:1. 数据通路宽度 2. 专用部件设置3. 对部件的共享程度 4. 功能部件的并行度5. 控制机构的组成方式 6. 缓冲和排队技术 7. 估计和预判技术 8. 可靠性,1.1.3 实现, 实现 指组成的物理实现, 包括:1. 处理机, 主存的物理结构 2. 器件集成度, 速度, 器件, 模块等的连接3. 专用器件的设计共享程度 4. 功能部件(如总线, 存储器)的并行度 5. 控制机构的组成方式 6. 底板的划分与连接 7. 电源的配置 8. 冷却、 安装技术, 元部件的互换性,系-组-实-模糊了,P6: 今天, 随着 VLSI 技术的飞速 发展, 计算

6、机系统结构, 计算机组成, 计算机实现三者之间的界限似乎变得模糊起来。 例如当初内存是计算机系统结构的重要问题, 今天内存容量和速度问 题已经不是系 统 结构必须优先考虑的首要问题了。诸如此类。 今天系统结构工作者的主要任务乃是研究并行处理, 输入输出, 流水线, 数据表示,指令系统,存储结构等等,目的是力图构造出优秀的计算机系统。,1.1.4 分类法 P6,1.1.4 计算机系统结构分类 (P6) Flynn分类法(Fig 1.2 P7) SISD, SIMD, MISD, MIMD 冯氏分类法(Fig 1.3 P8):最大并行度Pm:单位时间处理最大的比特数字串位串,字并位串,字串位并,字

7、并位并 Handler分类法(P9)t(型号)(k, d, w )其中 k 程序控制部件PCU个数d 算术逻辑部件ALU个数w每ALU所含基本逻辑线路ELC套数 w,指令流: 计算机执行的指令序列;(Instruction Stream)数据流: 指令流调用的数据序列;(Data Stream)多倍性: 瓶颈部件最大可并行执行的指令或数据个数,1.1.4 分类法,1.1.4.1 Flynn分类法分析(Fig 1.2 P7)首先我们介绍几个术语:于是我们可以讨论各类结构:1) 单指令流单数据流 SISD, 2) 单指令流多数据流 SIMD, 3) 多指令流单数据流 MISD,4) 多指令流多数据

8、流 MIMD,分类 P7,P7 Fig 1.2 Flynn 分类,分类 P7, 研究计算机系统结构, 目的在于设计最好、最快的系统。“好”的计算机系统, 首先体现在“快”。 为此提高系统对“经常性事件”的处理速度很重要。 设计好的系统实质上是改进已有系统,由此引出: Amdahl 定律(加速比定律):系统加速比 对系统某些部分(如内存或ALU )作改进, 其它部分不改进。唯有被改进部分对加速才有贡献。,1.2 设计技术,1.2 计算机系统设计技术 (P9), Amdahl 定律的数学表达 (P10)显然,系统加速比 SP 取决于1. 系统改进后被改进部分在系统中所占比例2. 被改进部分对系统性

9、能提高的贡献推出系统改进后的加速比 SP 式中f e :可改进部分E 所占比例,显然 0 f e 1re :可改进部分E 采用改进措施后所加快的倍数,1.2 Amdahl式,系 统,E,例: Amdahl 定律的应用 (P10 例1.1) 某系统某功能的速度加快 10 倍, 该功能部件的原来处理时间整个系统运行时间的 40% 。问采用改进措施后,整个系统的性能提高多少?解:从题意可知:可改进部分所占比例 f e 40% 采用改进措施所加快的倍数 re 10, 代入公式得答:采用该功能部件后系统性能提高1.56倍,1.2 Amd.例1,*Amdahl推论, 系统有多个部分被改进时的 Amdahl

10、 公式: ,未改进部分 fe 0,可改进部分fe1,可改进部分fe2,30%,50%,20%,以有两部分可改进的系统为例推导证明上式:(粗红线为执行时间),fe1速度提高5倍,耗时=0.5/5=0.1,fe0 耗时保持0.3,fe2 速度提高4倍, 耗时=0.2/4=0.05,fe0 耗时=0.3+0.1+0.05=0.45,则:Sp=1/(1-(0.5+0.2)+(0.1+0.05),例2: 某系统作技术改进后, CPU速度提高 50 倍。存储器存取速度提高 10 倍。若CPU 处理时间占系统运行时间的50%; 存储器存取时间占总运行行时间的20% 。改进后系统性能提高多少倍?解, 从题意:

11、 CPU 运行占系统运行比例 f e1 50% 单改进 CPU 所加快的倍数 re1 50; 存储 运行占系统运行比例 f e2 20% 单改进 存储 所加快的倍数 re210; 其余部分没有改进 f e0 30% 其余部分没有加快, 即 re0 1.,*Amd.例 2。,* 例2续,上述值代入 Amdahl 公式得改进后系统性能提高倍数:,未改进部 fe0,CPU部分fe1,存储部分fe2,0.3,0.5,0.2,0.02,0.01,0.3,0.3+0.01+0.02=3.03,改进后总运行时间,0.3,3 程序访问的局部性规律 (P11)统计表明, 一个程序中10的常用指令执行要花掉程序执

12、行时间的90, 这就是程序访问的局部性规律。例如 MOV指令, 算术逻辑指令运行常占总运行时间的约90.局部性规律表现为:. 在时间上,近期被访问的信息可能马上被再次访问。. 在空间上, 被访问地址的邻近地址可能紧接着被连续访问 (即程序可能访问一片连续的存储区)。,局部性规律,3 程序访问的局部性规律(续)局部性规律表现为:. 在时间上,近期被访问的信息可能马上被再次访问。. 在空间上, 被访问地址的邻近地址可能紧接着被连续访问 (即程序可能访问一片连续的存储区)。 局部性规律是采用虚拟存储和 Cache 的依据。规律表明,在一段时间内, 程序很可能使用一片连续的存储区,于是可将这些片映射为

13、Cache或虚存,从而使高速缓存和虚拟存储技术成为可能。,局部性规律,上片图示,A1:,A3:,A2:,JNS A3,A3:,JMP A2,A2:,A1:,JZ A5,局部性规律图示,程序在红色连 续存储区运行 到JNS A3转入起始地址 为A3的蓝色区 后,运行到指 令JMP A2转入起始地址 为A2的绿色区 后,运行到指 令JZ A5 ,JNS A3,JZ A5,JMP A2,内存,程序,1.2.2 计算机系统设计方法 1. 软件硬件取舍的基本原则. 高的性能/价格比。. 不必过多或不合理地限制各种组成和实现技术。. 从软硬两个角度考虑,使硬件为编译和操作系统的设计提供更好的支持。2. 系

14、统设计者的主要任务. 满足用户对系统功能要求及好的性能/价格比。. 设计优化:考虑软硬平衡,设计复杂性,实现难易。. 尽量考虑:设计应当适应以后的发展。3. 系统设计的基本方法. 自上而下 /. 自下而上/ . 中间开花,软硬并行,设计方法, 性能评估的关键指标是时间(或速率) 1.3.1 CPU评估法,以 TCPU 来评估系统一个程序在CPU 上运行所需时间定为TCPU ,则TCPU=INCPITC上式 IN 要执行的程序的指令总条数 TC 机器的时钟周期CPI 每条指令平均所需时钟周期数,而I i 为程序中第i类指令的数目,n为指令种类数,1.3性能评估,1.3 系统的性能评估(Perfo

15、rmance Evaluation, P13),1.3.2 MIPS 和MFLOPS 评估法 MIPS:每秒执行的指令数(单位: 百万条/秒) CPI 每条指令平均所需时钟周期数TC 机器的时钟周期RC 时钟周期的倒数,即频率 而有时也使用相对MIPSre l。选定的参照计算机ref式中带下标 ref 的量是被参照的计算机的值TV 是被评估计算机执行系统程序的时间,1.3.2Mips,MFL0PS:每秒可执行浮点运算次数( 百万次/秒) (P16)式中 I FN 被测程序中浮点运算的次数TE 执行该程序所费时间MFLOPS适合衡量向量计算机性能。同一程序在不 同计算机运行, 其浮点运算次数是一

16、样的。但不同浮 点指令的MFLOPS是不同的, 通常规定一个正则化值: 加、减、乘、比较指令正则化值为 1 除法及开方指 令为 4,三角函数等指令为 8 .通常, 在标量计算机: 1 MFLOPS3 MIPS(Note 1.3.3/ 1.3.4 / 1.3.5 ignored),MFLOPS,1.4.1 计算机系统结构的演变:改良和革命。 V.Neuman 机(主机)特点: 存储程序工作方式/ 二进制及机器语言/ 以运算器为中心的单处理器/ 控制器指令串行/ 线性等长存储器 V.Neuman机存在的主要缺点:1. 存在两个瓶颈:物理瓶颈和智能瓶颈2. 低级语言和高级语言之间巨大语义差距,要靠大

17、量复杂的软件程序来填补。3. 复杂数据结构只有经过地址映像,才能直接存储到一维线性地址空间。,1.4 发展1,1.4 计算机系统结构的发展 (P24), 半个世纪对计算机系统的改良、革命和演化: 1. 增加新的数据表示:如浮点数,字符串,十进制数等2. 采用了虚拟存储器:方便高级语言编程3. 引入堆栈:支持过程调用, 递归, 表达式求值4. 采用变址寄存器:支持复杂数据机构5. 增加GPR及Cache :降低CPU与Mm信息交换过频6. 采用交叉存储/无冲突存储技术:增加存储器带宽7. 采用流水技术:加快操作执行速度8. 采用多功能部件:指令在不同功能部件作并发操作,1.4.1 改革,P24-

18、26,9. 采用支持处理机: 如协处理机、I/O处理机等10.采用自定义数据: *11.程序和数据空间分开: 以增加存储器带宽以上措施提高了计算机运行速度,最后三条超出了V.Neuman 机的基本机构。上述措施的实现,使计算机的系统机构从以ALU为 中心演变为以存储器为中心。系统机构的革命, 导致了数据流计算机、需求驱动计算机乃至智能计算机的出现。计算机系统性能的发展趋势是“3T”目标: 每秒1万亿次的浮点计算能力(1TFLOPS) 主存应达到存储容量(1TB主存) 每秒达到吞吐率(1TB/S),1.4.1 续,P25,V.Neumann机原始结构以运算器为中心,基本方框图,V.Neumann

19、机结构,演化为以存储器为中心,基本方框图,输入 设备,控制器,(P 25)图1.4,数 据,存储器,地 址,指 令,输出 设备,结 果,运算器,状 态,命 令,命令,命令,请求,请求,主机,1.4.2 软件、应用、器件对系统机构发展的影响 1.4.2.1 软件对系统结构的影响 :软件危机:相对于硬件, 软件结构越来越复杂, 编写越来越难, 排错越来越不容易;导致软件生产效率低下, 供需矛盾越来越大, 造成了“软件危机”问题导致解决办法的研究, 其中我们要讨论的是:. 办法之一: 采用统一的高级语言;. 办法之二: 采用系列机和兼容机;. 办法之三: 采用模拟和仿真技术。,1. 软硬影响,术语浅

20、释 软件危机:软件生产相对于硬件生产的困难。 软件移植:一机器的软件不经修改或只作很小修改便可在另一机器运行, 称该软件有可移植性。 系 列 机:同一厂家生产、具有相同系统机构但有不.同组成和实现的一系列计算机。 兼 容 机:同上,但由不同厂家生产的计算机。 模 拟:为实现不同结构的的机器之间的软件移植所采用的一种软件方法 仿 真:为实现上条所述目的,除采用的软件方法 外, 同时还采用硬件或硬件加固件的方法。,术语解释,术语浅释 2 兼 容:软件的一种性能, 使一种软件适应多种机器 多倍性:在系统受限制的部件(瓶颈)同时处在同一执行阶段的可并行执行的指令或数据的最大可能的个数 指令流:机器执行

21、的指令序列 数据流:由指令调用的数据序列 翻 译:将信息从一种语言转换为另一种语言,而保持其意义不变 解 释:B 机一条指令, 用A机相应的一段指令完全代替, 在A机执行结果不变。称“用A 解释 B”,术语解释2,模拟,仿真图示,高级语言级,汇编语言级,操作系统级,传统机器级,微程序机器级,高级语言级,操作系统级,传统机器级,高级语言级,汇编语言级,操作系统级,传统机器级,微程序机器级,高级语言级,操作系统级,传统机器级,A.宿主机,A.宿主机,B.虚拟机,B.目标机,P29,Fig1.5 在A机上实现B机的指令系统, 模拟方法(速度较慢), 仿真方法(速度较快),1.4. 2. 2 应用对的

22、影响 . 应用是促使计算机发展的根本动力。 . 计算, 商务, 工控, 通信, 学习, 多媒体乃至日常生活要求有高速, 高存储容量, 高智能, 高I/O吞吐率。 . 信息之间关系导致对数据结构研究的深入, 也导致数据处理向信息处理方向发展, 数据库的出现了。需要有效地对信息项进行管理:增删, 查询, 变更, .。 . 在知识处理基础上, 能以自然形式实现人机对话. . 引入推理功能,可从事定理证明, 逻辑推理和自学习 . 真智能是人类对的最高要求, 可能永远无法实现。,2. 应用影响,P30 性价趋势,图1.6 计算机性能价格变化趋势(系统结构“下移”),图中虚线为等性能线。横坐标表年代,t为

23、70年代。纵 坐标表价格指数的对数。令70年代微型机价格指数为1,银河, MPP,IBM4347,IBM370,VAX,Alpha,80X86,Pentium,掌上机,掌上机,1.4. 2. 3 器件对的影响 . 器件的高密度组装, 光电子, VLSI,促成了计算机换代。 1. 从功能使用看:从非用户片现场片用户片。 2. 从器件在计算机中的地位看:主频从 msusns, 集成度体积可靠性价格. 从存储器的性能使Cache和虚存 得以实现, 从而推出向量机 , 数组机 ,数据库机 ,等专用机型。. 系统价格“下移”速度加快。. 器件促进算法、语言和软件发展。促进MPP系统。 从计算机系统设计方法看:为缩短设计周期, 采用规整元部件, 使用 CAD 和 DAS 设计方法。,3. 器件影响,习题布置P32: 1. 2 . 6. 7. 10. 15. 注意:可以不抄题,但是每个题目与前一题目之间应当空隔一行。,P34,习题,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 网络科技 > 计算机原理

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报