收藏 分享(赏)

计算机体系结构chapter1-3.ppt

上传人:fmgc7290 文档编号:8461795 上传时间:2019-06-28 格式:PPT 页数:53 大小:270.50KB
下载 相关 举报
计算机体系结构chapter1-3.ppt_第1页
第1页 / 共53页
计算机体系结构chapter1-3.ppt_第2页
第2页 / 共53页
计算机体系结构chapter1-3.ppt_第3页
第3页 / 共53页
计算机体系结构chapter1-3.ppt_第4页
第4页 / 共53页
计算机体系结构chapter1-3.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

1、3 计算机系统的软硬取舍、性能评测及定量设计原理,软、硬取舍的基本原则 计算机系统的性能评测 计算机系统的设计原则 计算机系统设计者的主要任务 计算机系统的设计思路 计算机系统的设计步骤,控制流程的三种实现方法,全硬件、软硬件结合、全软件 逻辑上等价 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度慢、复制费用低;灵活性好、占用内存多、易设计、可改性强、适应性强、设计周期短; 理论上:由两种极端实现方法 全硬件机器:操作系统、高级语言、应用等 硬件只有1位加法和分支操作,其他都用软件 关键问题:性能与价格的关系 发展趋势 硬件实现的比例越来越高 硬件所占的成本越来越低,软硬件实现

2、的优缺点,计算机系统的软、硬件功能分配,发展,不可编程,目前计算机,最少硬件,软件,硬件,软 硬 件 比 例,计算机系统的软、硬件成本变化,软硬取舍的基本原则,很高的性能价格比 设:D为研制设计费用,M为重复生产费用h为硬件,s为软件。则: 设C:该功能在软件实现时许重新设计的次数;R:存储介质上出现的次数;V:生产的台数; 则硬件的费用: 软件的费用:,软硬取舍的基本原则(续),则只有: 将上述带入 : 可见:只有在C和R的值较大时,才成立。 由于: 则: 因为:C100所以V值越大,上式成立。即产量大。,软硬取舍的基本原则(续),考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合

3、理地限制各种组成、实现技术的采用; 不能仅从“硬”的角度去考虑如何便于应用组成技术的成果和发挥器件技术的进展,还应从“软”的角度把为编译和操作系统的实现,以至高级语言程序的设计提供更多更好的硬件支持放在首位;,软硬取舍的基本原则(续),考虑用户的应用领域:专用硬件 设计周期长的硬件不宜采用 常用的功能尽量采用硬件实现 实现功能的成本性能比(或价格性能比)要低 尽量采用新技术实现超前设计,举例1:,某一计算机用于商业外贸的事务处理,有大量的字符串操作。由于这种事务处理很普遍,有较大的市场,故而设计人员决定在下一代此类计算机的CPU中加入字符串操作的功能。经测试应用软件调查发现,字符串操作的使用占

4、整个程序运行时间的50%,而增加此功能如用软件(如微程序)实现,则快5倍,增加CPU成本1/5倍;如果用硬件实现,则快100倍,CPU成本增加到5倍。问设计人员提出增加此功能是否恰当?是否用软件还是硬件?设CPU成本占整机成本的1/3。,硬件实现,软件实现,举例2:,如果上例中,字符串操作功能的使用时间占整个程序运行时间的90%,则情况如何?,硬件实现,软件实现,计算机系统的性能评价,时钟频率 指令执行速度 平均速度 核心程序法 峰值速度,时钟频率,运算速度是表示处理机性能的主要指标,有多种表示处理机运算速度的方法,哪一种表示方法更加合理? 时钟频率(处理机主频)只能用于同一类型、同一配置的处

5、理机,相对比较 Pentium4 3.2GHZ比Pentium4 1.6GHZ快一倍? Pentium4 2.4GHZ比Pentium4 1.6GHZ快50%? 实际运算速度还与Cache、内存、IO、被执行程序等均有关,指令的执行速度,一种经典的表示运算速度的方法MIPS(Million Instructions Per Second), GIPS, TIPS 其中: Fz为处理机的工作主频CPI(Cycles Per Instruction)为每条指令所需的平均时钟周期数IPC(Instruction Per Cycle)为每个时钟周期平均执行的指令条数,例1:计算PentiumIV 3G

6、Hz 处理机的速度,解:由于PentiumIV3GHz 处理机的IPC4(或CPI0.25)Fz3000MHzMIPSPentiumIV3GFzIPC 3000412000MIPS12GIPS峰值速度秒120亿次/秒,实际速度约50亿次/秒主要优点:直观、方便。目前经常使用主要缺点:(1) 不同指令的执行速度差别很大(2) 指令使用频度差别很大(3) 有相当多的非功能性指令,计算机系统的评测,性能指标体现在时间和空间 峰值性能:在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能 实际性能(持续性能):只是峰值性能的5%-30%,平均速度,算术性能平均值:调和性能平均值:几

7、何性能平均值:,加权算术平均值:加权调和平均值:加权几何平均值:,加权方法 静态指令使用频度:在程序中直接统计 动态指令使用频度:在程序执行过程中统计 吉普森(Gibson)法: 加减法:50, 乘法:15, 除法:5, 程序控制:15, 其他:15,CPU性能公式,CPU的性能取决于三个要素:时钟频率f(或时钟周期t);每条指令所花的时钟周期数CPI;指令条数IC 一个程序所花的CPU时间(T)可以用两种方式来表示: CPU时间(T)=CPU时钟周期数(CPIIC)*时钟周期长(t),每条指令的平均时钟周期数:,计算CPU的程序时间:IC (Instruction Counter):程序执行

8、的总指令条数 CPI (Cycles Per Instruction):平均每条指令的时钟周期 Fc:主时钟频率,假设系统共有n种指令,第i种指令在程序中出现的次数为Ii,这样:,MIPS(Million Instruction Per Second),MFLOPS(Million Floating Point Per Second),核心程序法,定点测试程序:Dhrystone 用C语言编写,100条语句。包括:各种赋值语句,数据类型和数据区,控制语句,过程调用和参数传送,整数运算和逻辑操作等。 VAX-11/780的测试结果为每秒1757,即1VAX MIPS1757 Dhrystones

9、Second 浮点测试程序:Linpack 用FORTRAN编写,主要是浮点加法和浮点乘法,用MFLOPS (Million Floating Point Operations Per Second)表示,GFLOPS、TFLOPS1.2.4,SPEC Standard Performance Evaluation Cooperativewww.spec.org 由30个左右世界知名计算机大厂商所支持的非盈利性国际合作组织,包括:IBM、AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、SGI、SUN、Unisys等 1989

10、年10月宣布SPEC1.0,程序量超过15万行,包含4个定点程序和6个浮点程序, 测试结果用SPECint89和SPECfp89表示。 1992年增加到有6个定点程序和14个浮点程序,测试结果用SPECint92和SPECfp92表示 1995年推出SPECint95和SPECfp95 SPEC2000,12个定点程序、14个浮点程序 目前:CPU,Graphics/Workstation,MPI/OMP,Java Client/Server,Mail Server,Network File System,Power,SIP,SOA,Virtualization,Web Servers,评测方

11、法,采用实际的应用程序测试 如:C语言的编译程序 Spice:Simulation Program with Integrated Circuit Emphasis,是一种用于电路描述与仿真的语言与仿真器软件,用于检测电路的连接和功能的完整性,以及用于预测电路的行为。主要用于模拟电路和混合信号电路的仿真。 采用核心程序测试 从实际程序中抽出关键部分组合而成 合成测试程序 人为写的核心程序,规模小,结果预知 综合基准测试程序,峰值速度,峰值指令速度:MIPS、GIPS、TIPS 浮点峰值速度:MFLOPS、GFLOPS、TFLOPS 例5:一个由256台计算机组成的Cluster系统,每台计算机

12、由4个PentiumIV3GHz的CPU组成,计算这个Cluster系统的浮点峰值速度。解:PentiumIV3GHz,有4条浮点流水线,浮点峰值速度为:3 412GFLOPSCluster的浮点峰值速度3425612.288GFLOPS 即每秒12万亿次,计算机系统的定量设计原理,哈夫曼压缩原理Amdahl定律程序访问的局部性规律,哈夫曼压缩原理,尽可能加速高概率事件远比加速处理概率很低的事件对性能提高要显著。,只加速使用频率高的部件,Make the common case fast 例如:CPU中的加法,溢出情况。这是计算机设计中最重要也最广泛采用的设计准则。使经常性事件的处理速度加快能

13、明显提高整个系统的性能。,Amdahl定律,系统对某一部件采用某种更快执行方式所能获得的系统性能改进程序,取决于这种执行方式被使用的频率,或所占总执行时间的比例。,Amdahl定律(续),定义了加速比的大小,Amdahl加速比(续),Amdahl例1.1,假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少? 解:由题意可知:fe=0.4, re=10,根据Amdahl定律,Amdahl例1.2,采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大。假设FPSQR操作占整个测试程序执行时间的20%

14、。一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。请比较这两种设计方案。,Amdahl例1.2,解:分别计算出这两种设计方案所能得到的加速比:,CPU性能公式,CPU的性能取决于三个要素:时钟频率f(或时钟周期t);每条指令所花的时钟周期数CPI;指令条数IC 一个程序所花的CPU时间(T)可以用两种方式来表示: CPU时间(T)=CPU时钟周期数(CPIIC)*时钟周期长(t),每条指令的平均时钟周期数:,例1.3,如果FP操作的比例为25%,FP操作的平均C

15、PI=4.0,其它指令的平均CPI为1.33,FPSQR操作的比例为2%, FPSQR的CPI为20。假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。,例1.3的解答,解:原系统的CPI=25%4+75%1.33=2 方案1(使FPSQR操作的CPI为2)系统CPI=CPI原-2%(20-2)=2-2%18=1.64 方案2(提高所有FP指令的处理速度)系统CPI=CPI原-25%(4-2)=2-25%2=1.5 我们也可以根据以下公式计算出方案2系统的CPICPI= 7

16、5%1.33+25%2=1.5 显然,提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。方案2的加速比=2/1.5= 1.33,程序访问的局部性规律,局部性分时间上的局部性和空间上的局部性 时间局部性:程序中近期被访问的信息项很可能马上将被再次访问。 空间局部性:指那些在访问地址上相邻近的信息项很可能会被一起访问。 存储器体系的构成就是以访问的局部性原理为基础的。,计算机系统设计者的主要任务,满足用户对功能上的要求以及相应的价格性能要求满足功能要求的基础上,进行优化设计设计应能适应日后的发展趋势,硬件与软件的发展,硬件: 晶体管数: 增加25%/年, 三年一倍 DRAM的密度

17、: 60%/年, 二年三倍 访存周期: 减少33%/十年 硬盘密度: 增加25%/年 访问时间: 减少33%/十年 软件: 程序空间: 1.52位/年 地址: 0.51位/年,计算机系统设计思路,由上往下(Top-down)由下往上(Bottom-up)由中间开始(Middle-out),由上往下(Top-down),设计过程:由上向下 面向应用的数学模型 面向应用的高级语言 面向这种应用的操作系统 面向操作系统和高级语言的机器语言 面向机器语言的微指令系统和硬件实现 应用场合:专用计算机的设计(早期计算机的设计) 特点:对于所面向的应用领域,性能和性能价格比很高,应用对象变了,难以适应。 随

18、着通用计算机价格降低,目前已经很少采用,由下往上(Bottom-up),设计过程: 根据当时的器件水平,设计微程序机器级和传统机器级。 根据不同的应用领域设计多种操作系统、汇编语言、高级语言编译器等。 最后设计面向应用的虚拟机器级。 应用场合: 在计算机早期设计中(6070年代)广为采用 特点: 容易使软件和硬件脱节 软件被动,某些性能指标不确切 整个计算机系统的效率降低。,由 下 往 上 设 计,由中间开始(Middle-out),设计过程: 首先定义软硬件的分界面,包括:指令系统、存储系统、输入输出系统、中断系统、硬件对操作系统和编译系统的支持等 然后各个层次分别进行设计: 软件设计人员设计操作系统、高级语言、汇编语言、应用出现等; 硬件设计人员设计传统机器、微程序、硬联逻辑等 应用场合:用于系列机的设计 特点: 软硬件的分界面在上升; 硬件价格下降,软件价格上升; 软硬件人员结合共同设计,有利于缩短周期 随着硬软件技术的发展,设计的中间点由上升的趋势。,计算机系统的设计步骤,需求分析 主要在应用环境、所用语言的种类及特性、对OS的特殊要求 所用外设特性、技术经济指标、市场分析等方面。 需求说明 主要包括设计准则、功能说明、器件性能说明等。 概念性设计 进行软、硬件功能分析,确定机器级界面 具体设计 机器级界面各方面的确切定义,可考虑几种方案 反复进行优化设计及评价,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报