1、桂林理工大学 邹老师的弟子题目六:选取一款带高速缓存的 CPU,对其高速缓冲存储器的工作原理进行介绍(这是我精心制作的论文报告,貌似那时候得 85 分。可以参考。 )目录:一:介绍计算机系统和工作原理二:介绍存储系统和结构三:介绍 CPU 各项功能指标四:介绍带高速缓冲存储器的工作原理五:介绍一款带高速缓冲存储器的工作原理详细介绍:(一)计算机系统和工作原理计算机(指硬件)应由运算器、存储器、控制器、输入设备、输出 设备 5 大基本部件组成;计算机内部采用二进制来表示指令和数据;将编好的程序和原始数据事先存入存储器中,然后再启动计算机工 作,这就是存储程序的基本含义。通常将运算器和控制器合称为
2、中央处理器(Central Processing Unit,CPU) 。在由超大规模集成电路构成的微型计算机中,往往将CPU 制成一块芯片,成为微处理器。后面将详细介绍 CPU 的具体内容。计算机组成原理图:1、计算机系统的多层次结构第一级是微程序级。这级的机器语言是微指令集,程序员用微指令编写的微程序一般是直接由硬件执行的。第二级是传统机器级。这级的机器语言是该机的指令集,程序员用机器指令编写的程序可以由微程序进行解释。第三级是操作系统级。从操作系统的基本功能来看,一方面它要直接管理传统机器中的软硬件资源,另一方面它又是传统机器的延伸。第四级是汇编语言级。这级的机器语言是汇编语言,它完成汇编
3、语言翻译的程序叫做汇编程序。第五级是高级语言级。这级的机器语言就是各种高级语言,通常用编译程序来完成高级语言翻译的工作。第六级是应用语言级。这一级是为了使计算机满足某种用途而专门设计的,因此这一级语言就是各种面向问题的应用语言。(2)介绍存储系统和结构存储系统是由几个容量、速度和价格各个不同的存储器构成的系统。1、按存储器在计算机系统中的作用分类,可以分为三类存储器:高速缓冲存储器:高速缓冲存储器(Cache)位于主存和 CPU 之间,用来存放正在执行的程序段和数据,以便 CPU 能高速地使用它们。主存储器:主存用来存放计算机运行期间所需要的程序和数据,CPU 可直接随机地进行读/写访问。主存
4、具有一定容量,存取速度较高。由于 CPU 要频繁地访问主存,所以主存的性能在很大程度上影响了整个计算机系统的性能。辅助存储器:辅助存储器又称外存储器或后援存储器,它用来存放 当前暂不参与运行的程序和数据以及一些需要永久性保存的信息。 辅存设在主机外部,容量极大且成本很低,但存取速度较低,而且 CPU 不能直接访问它。2、存储系统层次结构由高速缓冲存储器、主存储器、辅助存储器构成的三级存储系统可以分为两个层次,其中高速缓存和主存之间成为 Cache主存储层次,主存储和辅存之间称为主存赋存存储层次。Cache 存储系统是为解决主存速度不足而提出来的。在 Cache 和主存之间,增加辅助硬件,让它们
5、构成一个整体。从 CPU 看,速度接近 Cache 的速度,容量是贮存的容量。3、主存储器和 CPU 的连接主存和 CPU 之间的硬连接:主存和 CPU 的硬连接有 3 组连线,地址总线(AB) 、数据总线(DB)和控制总线(CB) 。存储器地址寄存器(MDR)是主存和 CPU 之间的接口。MAR 可以接受来自程序计数器(PC)的指令地址或者来自地址形成部件的操作数地址,以确定要访问的单元。MDR 是向主存写入数据或者从主存读出数据的缓冲部件。MAR 和 MDR 从功能上看属于主存,但是在小型计算机、微型计算机中常放在 CPU 内。(3)介绍 CPU 各项功能指标中央处理器(CPU)是整个计算
6、机的核心,它包括运算器和控制器。CPU 对整个计算机系统的运行是极其重要的,这里将从 CPU 的功能,内部结构和主要参数入手,为后面详细讨论程序的执行过程打下基础。1、CPU 的功能:若用计算机来解决某个问题,首先要为这个问题编制解题程序,而程序又是由指令的有序集合。按照“存储程序”的概念,只要把程序装入主存储器后,即可由计算机自动地完成取指令和执行指令的任务。2、CPU 中的主要寄存器:CPU 中的寄存器是用来暂时保存运算器和控制过程中的中间结果、最终结果以及控制、状态信息的,它可以分为通用寄存器和专用寄存器两大类。通用寄存器可以用来存放原始数据和运算结果,有的还可以作为变址寄存器、计数器、
7、地址指针等。累加寄存器 Acc 也是一个通用寄存器,它用来暂时存放 ALU 运算的结果信息。例如,在执行一个加法运算前,先将一个操作数暂时存放在 Acc 中,再从主存中取出另一个操作数,然后同 Acc 的内容相加,所得的结果送回 Acc 中。运算器中至少要有一个累计寄存器。专用寄存器是专门用来完成某一种特殊功能的寄存器。CPU 中至少要有 5 个专用的寄存器。它们是:程序计数器(PC) 、指令寄存器(IR) 、存储器地址寄存器(MAR) 、存储器数据寄存器(MDR) 、状态标志寄存器(PSWR) 。3、CPU 的组成:CPU 由运算器和控制器两大部分组成。控制器的主要功能:从主存中取出一条指令
8、,并指出下一条指令在主存中的位置。对指令进行译码或测试,产生相应的操作控制信号,以便启用规定的动作。指挥并控制 CPU、主存和输入输出设备之间的数据流动方向。运算器的主要功能:执行所有的算术运算;执行所有的逻辑运算,并进行逻辑测试。4、CPU 的主要技术参数字长:CPU 的字长是指在单位时间内同时处理的二进制数据的位数。CPU 按照其处理信息的字长可以分为:8 位 CPU、16 位 CPU、32位 CPU 以及 64 位 CPU 等。内部工作频率:又称为内频或主频,它是衡量 CPU 速度的重要参数。内部时钟频率的倒数是时钟周期,这是 CPU 中最小的时间元素。外部工作频率:它是由主板为 CPU
9、 提供的基准时钟频率。片内 Cache 的容量:片内 Cache 又称 CPU Cache,它的容量和工作速率对提高计算机的速度起着至关重要的作用。工作电压:工作电压指的是 CPU 正常工作所需要的电压。随着CPU 的制造工艺与内频的提高,近年来各种 CPU 的工作电压有逐步下降的趋势,以解决发热问题。5、微程序控制器的组成和工作过程: 1、 微程序控制器的基本组成:控制存储器(CM):这是微程序控制器的核心部件,用来存放微程序,其性能(包括容量、速度、可靠性等)与计算机的性能密切相关。 微指令寄存器(uIR):用来存放从 CM 中取出的微指令,它的位数同微指令字长相等。微地址形成部件:用来产
10、生初始微地址和后继微地址,以保证微指令的连续执行。微地址寄存器(uMAR):它接受微地址形成部件送来的微地址,为在 CM 中读取微指令做准备。2、微程序控制器的工作过程:执行取令公共操作。取指微程序的入口地址一般为 CM 的 0 单元,当取指微程序执行完后,从主存中取出的机器指令就已经存入指令寄存器中了。由机器指令的操作码字段通过微地址形成部件产生改机器指令所对应的微程序的入口地址,并送入 uMAR。从 CM 中逐条取出对应的微指令并执行之。执行完对应于一条机器指令的一个微程序后又回到取微程序的入口地址,继续第步,以完成取下一条机器指令的公共操作。(四)介绍带高速缓冲存储器的工作原理1、基本概
11、念:高速缓冲存储器(Cache)比主存储器体积小但速度快,用于保有从主存储器得到指令的副本,很可能在下一步为处理器所需的专用缓冲器。在计算机存储系统的层次结构中,介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。2、Cache 的基本结构:Cache 和主存都被分为若干个大小相等的块,每个块由若干字节组成。由于 Chche 的容量远小于主存中的块数,它保存的信息只是主存中最急需执行的若干块的副本。高速缓冲存储器是存在于主存与 CPU 之间的一级存储器, 由静态存储芯片(SRAM)组成,容量比较小但速
12、度比主存高得多, 接近于 CPU 的速度。用主存地址的块号字段访问 Cache 标记,并将取出的标记和主存地址的标记字段相比较。若相等,说明访问 Cache 有效,称为 Cache 命中;若不相等,说明访问 Cache 无效,称 Cache 不命中或失效。Cache 的结构和工作原理图2、作用介绍:在计算机技术发展过程中,主存储器存取速度一直比中央处理器操作速度慢得多,使中央处理器的高速处理能力不能充分发挥,整个计算机系统的工作效率受到影响。有很多方法可用来缓和中央处理器和主存储器之间速度不匹配的矛盾,如采用多个通用寄存器、多存储体交叉存取等,在存储层次上采用高速缓冲存储器也是常用的方法之一。
13、很多大、中型计算机以及新近的一些小型机、微型机也都采用高速缓冲存储器。3、条件介绍:程序的局部性有两个方面的含义:时间局部性和空间局部性。时间局部性是指如果一个存储单元被访问,则可能该单元会很快被再次访问。空间局部性是指如果一个存储单元被访问,则该单元邻近的单元也可能很快地被访问。高速缓冲存储器的容量一般只有主存储器的几百分之一,但它的存取速度能与中央处理器相匹配。当中央处理器存取主存储器某一单元时,计算机硬件就自动地将包括该单元在内的那一组单元内容调入高速缓冲存储器,中央处理器即将存取的主存储器单元很可能就在刚刚调入到高速缓冲存储器的那一组单元内。于是,中央处理器就可以直接对高速缓冲存储器进
14、行存取。在整个处理过程中,如果中央处理器绝大多数存取主存储器的操作能为存取高速缓冲存储器所代替,计算机系统处理速度就能显著提高。4、Cache 的读写操作 Cache 的读操作:当 CPU 发出读请求时,如果 Cache 命中,就直接对 Cache 进行读操作,与主存无关;如果 Cache 不命中,则仍需要访问主存,并把该块信息一次从主存调入 Cache 内。若此时Cache 已满,则需要根据某种替换算法,用这个块替换掉 Cache中原来的某块信息。 Cache 的写操作:由于 Cache 中保存的只是主存的部分副本,这些副本与主存中的内容能否相一致,是 Cache 能否可靠工作的一个关键问题
15、。当 CPU 发出写请求时,如果 Cache 命中,由可能会遇到 Cache 与主存中的内容不一致的问题。所以如果 Cache 命中,需要进行一定的写处理,处理的方法有:写直达法和写回法。如果 Cache 不命中,就直接把信息写入主存,并有两种处理方法:不按写分配法,即只把所要写的信息写入主存。按写分配法,即在把所要写的信息写入主存后还把这个块从主存中 读入 Cache。5、工作原理:高速缓冲技术就是利用程序的局部性原理,把程序中正在使用的部分存放在一个高速的容量较小的 Cache 中,使 CPU 的访存操作大多数针对 Cache 进行,从而使程序的执行速度大大提高。高速缓冲存储器通常由高速存
16、储器、联想存储器、替换逻辑电路和相应的控制线路组成。在有高速缓冲存储器的计算机系统中,中央处理器存取主存储器的地址划分为行号、列号和组内地址三个字段。于是,主存储器就在逻辑上划分为若干行;每行划分为若干的存储单元组;每组包含几个或几十个字。高速存储器也相应地划分为行和列的存储单元组。二者的列数相同,组的大小也相同,但高速存储器的行数却比主存储器的行数少得多。联想存储器用于地址联想,有与高速存储器相同行数和列数的存储单元。当主存储器某一列某一行存储单元组调入高速存储器同一列某一空着的存储单元组时,与联想存储器对应位置的存储单元就记录调入的存储单元组在主存储器中的行号。当中央处理器存取主存储器时,
17、硬件首先自动对存取地址的列号字段进行译码,以便将联想存储器该列的全部行号与存取主存储器地址的行号字段进行比较:若有相同的,表明要存取的主存储器单元已在高速存储器中,称为命中,硬件就将存取主存储器的地址映射为高速存储器的地址并执行存取操作;若都不相同,表明该单元不在高速存储器中,称为失效,硬件将执行存取主存储器操作并自动将该单元所在的那一主存储器单元组调入高速存储器相同列中空着的存储单元组中,同时将该组在主存储器中的行号存入联想存储器对应位置的单元内。当出现失效而高速存储器对应列中没有空的位置时,便淘汰该列中的某一组以腾出位置存放新调入的组,这称为替换。确定替换的规则叫替换算法,常用的替换算法有
18、:最近最少使用法(LRU)、先进先出法(FIFO)和随机法(RAND)等。替换逻辑电路就是执行这个功能的。另外,当执行写主存储器操作时,为保持主存储器和高速存储器内容的一致性,对命中和失效须分别处理:写操作命中时,可采用写直达法(即同时写入主存储器和高速存储器)或写回法(即只写入高速存储器并标记该组修改过。淘汰该组时须将内容写回主存储器);写操作失效时,可采用写分配法(即写入主存储器并将该组调入高速存储器)或写不分配法(即只写入主存储器但不将该组调入高速存储器)。高速缓冲存储器的性能常用命中率来衡量。影响命中率的因素是高速存储器的容量、存储单元组的大小、组数多少、地址联想比较方法、替换算法、写
19、操作处理方法和程序特性等。采用高速缓冲存储器技术的计算机已相当普遍。有的计算机还采用多个高速缓冲存储器,如系统高速缓冲存储器、指令高速缓冲存储器和地址变换高速缓冲存储器等,以提高系统性能。随着主存储器容量不断增大,高速缓冲存储器的容量也越来越大。(5)介绍一款带高速缓存的 CPU介绍 Intel I5Intel I5 核心线程数 4 核心 4 线程数 二级缓存 4*256KB 三级缓存 8M TDP 95W 它实质是一种集成在芯片中的嵌入式系统,不依赖特定的操作系统,这也是 IAMT 与远程控制软件最大的不同。 该技术允许 IT 经理们远程管理和修复联网的计算机系统,而且实施过程是对于服务对象
20、完全透明的,从而节省了用户的时间和计算机维护成本。工作原理Intel i5技术的嵌入式操作系统集成在硬件中其功能由主板上的ME(management engine)(ME 物理运算能力由北桥芯片提供)来实现。释放出来的 i5构架规格描述该技术是处于芯片组、网络控制器和处理器之间一条特殊接口,通过该接口开启 Intel I5 去连接相应的管理和安全软件,以及客户端嵌入式监控模块。主要功能Intel i5 技术可以作为一个独立于现有操作系统的子系统出现,这样就解决了目前困扰 IT 维护管理人员的一个主要问题,用户故意或者是无意自己关闭了自己 PC 上的安全和管理软件。 英特尔主动管理技术的诞生让电
21、脑管理从简单的信息查询、现场维护为主的被动式管理走向了自动发现、诊断、排除故障和综合性防护的主动管理之路。无论是资产盘点、远程诊断和管理、事故报警/恢复、软件分发还是系统安全防护与隔离,很多功能都是自动形成并发挥作用。Intel i5能够自动执行一个独立于操作系统的子系统,正是由于有了独立于操作系统的环境,使得在操作系统出现故障的时候,管理员能够在远程监视和管理客户端。通过这项原本专属于服务器应用领域的技术,未来的个人电脑将可以在操作系统损毁或系统出现故障的时候进行远程管理和检测系统,或是系统发生错误时主动发出警告信息,进行软硬件检查、远端更新 BIOS、病毒码及操作系统,甚至在系统关机的时候
22、,也可以通过网络进行管理工作,对企业用户而言,可大幅降低管理成本。英特尔打算通过这种方式导入 i5 远端管理技术,吸引企业用户对计算机进行升级。英特尔的嵌入式系统英特尔的嵌入式系统是面向用户、面向产品、面向应用的,它必须与具体应用相结合才会具有生命力、才更具有优势。因此可以这样理解上述三个面向的含义,即嵌入式系统是与应用紧密结合的,它具有很强的专用性,必须结合实际系统需求进行合理的裁减利用。嵌入式系统是将先进的计算机技术、半导体技术和电子技术和各个行业的具体应用相结合后的产物。嵌入式系统必须根据应用需求对软硬件进行裁剪,满足应用系统的功能、可靠性、成本、体积等要求。所以,如果能建立相对通用的软
23、硬件基础,然后在其上开发出适应各种需要的系统,是一个比较好的发展模式。目前的嵌入式系统的核心往往是一个只有几 K 到几十 K 微内核,需要根据实际的使用进行功能扩展或者裁减,但是由于微内核的存在,使得这种扩展能够非常顺利的进行。一般而言,嵌入式系统的构架可以分成四个部分:处理器、存储器、输入输出(I/O)和软件(由于多数嵌入式设备的应用软件和操作系统都是紧密结合的,在这里我们对其不加区分,这也是嵌入式系统和一般的 PC 操作系统的最大区别) 。报告总结:通过介绍一款高速缓存的 CPU 的工作原理,我更深刻明白了一台计算机所包含的各种软硬件之间的密切联系,明白了计算机的工作原理还有中央处理器的工作原理。在社会经济高速发展的今天,世界已经进入了计算机时代,而新型的超导计算机、关子计算机、生物计算机和纳米计算机将会走进人们的生活,遍布各个领域。因此我们更要学好基本的理论知识,掌握计算机的基本工作原理,这样才能更好地运用计算机这个媒体,跟上社会进步的步伐。在书写这篇论文时,参考了一下文献:计算机组成原理(第2版) 蒋本珊 编著微处理器的结构与性能 易建勋 编著以及在网站上寻找到的一些资料。