收藏 分享(赏)

Cache(高速缓存)与主存一致性初探.doc

上传人:wo7103235 文档编号:7690369 上传时间:2019-05-23 格式:DOC 页数:22 大小:187.50KB
下载 相关 举报
Cache(高速缓存)与主存一致性初探.doc_第1页
第1页 / 共22页
Cache(高速缓存)与主存一致性初探.doc_第2页
第2页 / 共22页
Cache(高速缓存)与主存一致性初探.doc_第3页
第3页 / 共22页
Cache(高速缓存)与主存一致性初探.doc_第4页
第4页 / 共22页
Cache(高速缓存)与主存一致性初探.doc_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、Cache(高 速 缓 存 )与 主 存 一 致 性 初 探院 系 名 称 姓 名 学 号 专 业 计 算 机 科 学 与 技 术 专 业指 导 教 师 II摘 要存 储 器 是 具 有 “记 忆 ”功 能 的 部 件 , 它 在 计 算 机 系 统 中 占 有 十 分 重 要 的 地 位 。存 储 器 的 基 本 功 能 是 存 放 以 二 进 制 形 式 表 示 的 程 序 与 数 据 。 如 何 设 计 容 量 大 、 速 度快 且 造 价 低 的 存 储 器 , 一 直 是 计 算 机 发 展 中 的 关 键 问 题 , 目 前 还 没 有 哪 一 种 存 储 器功 能 完 全 满 足

2、 计 算 机 系 统 对 存 储 器 的 需 求 。 因 此 , 计 算 机 系 统 通 常 配 备 分 层 结 构 的存 储 系 统 , 以 满 足 容 量 、 速 度 和 造 价 等 方 面 的 要 求 。衡 量 存 储 器 有 三 个 指 标 : 容 量 、 速 度 和 价 格 /位 。 一 般 地 说 , 速 度 高 的 存 储 器 ,每 位 价 格 也 高 , 因 此 容 量 不 能 太 大 。 所 以 存 储 器 设 计 的 约 束 有 容 量 、 速 度 和 价 格 。容 量 似 乎 没 有 限 制 , 不 管 容 量 多 大 , 总 要 开 发 出 应 用 程 序 来 使 用

3、。 为 了 获 得 更 好 的性 能 , 存 储 器 的 速 度 必 须 能 够 跟 上 CPU, 即 当 CPU 执 行 指 令 时 , 不 想 让 他 停 下 来 等待 指 令 或 操 作 数 。 价 格 问 题 也 必 须 考 虑 , 对 于 实 用 的 系 统 , 存 储 器 的 价 格 必 须 相 对于 其 他 部 件 是 合 理 的 。 因 此 三 个 指 标 之 间 需 要 进 行 权 衡 。高 速 缓 存 系 统 中 能 否 确 保 高 速 缓 冲 存 储 器 和 主 存 内 容 一 致 性 , 这 个 问 题 直 接 关 系 到整 个 计 算 机 系 统 的 性 能 。 这

4、两 部 分 的 数 据 一 致 性 问 题 产 生 的 原 因 有 二 : 其 一 , 由 于 CPU对 高 速 缓 冲 存 储 器 的 写 入 导 致 它 的 内 容 更 新 而 主 存 内 容 陈 旧 ; 其 二 , 由 于 I/O 处 理 机 或多 处 理 机 系 统 中 某 一 处 理 机 修 改 了 主 存 内 容 导 致 高 速 缓 冲 存 储 器 内 容 陈 旧 。 针 对 不 同 原因 , 分 析 了 写 策 略 中 七 种 解 决 方 案 , 并 就 高 速 缓 存 系 统 采 用 的 第 二 级 脱 片 高 速 缓 冲 存 储器 , 以 及 第 三 级 脱 片 高 速 缓

5、冲 存 储 器 结 构 数 据 一 致 性 问 题 进 行 初 步 探 讨 。本 文 通 过 对 存 储 器 系 统 Cache( 高 速 缓 存 ) 与 主 存 的 概 念 进 行 描 述 和 目 前 两 者 之 间一 致 性 存 在 的 一 些 问 题 进 行 研 究 。 并 分 析 在 多 处 理 机 系 统 中 , 主 存 与 各 处 理 机 私 有Cache 之 间 及 各 私 有 Cache 之 间 存 在 的 数 据 不 一 致 性 。 对 解 决 不 一 致 性 的 方 法 : 监 听 总线 协 议 、 基 于 目 录 的 Cache 一 致 性 协 议 、 软 件 控 制 方

6、 法 等 进 行 详 细 的 定 性 分 析 , 并 指 出各 种 方 法 的 优 缺 点 , 供 设 计 者 参 考 ; 同 时 提 出 软 件 和 硬 件 相 结 合 的 方 法 , 能 有 效 解 决Cache 的 一 致 性 问 题 。关 键 词 : 存 储 器 ; 主 存 ; 缓 存 ; 一 致 性IIIAbstractMemory is a “ memory “ function components , it in a computer system occupies a very important position . The basic function of memory

7、 is stored in binary form of said programs and data . How to design capacity , speed is quick and low cost of memory , is always the key problems in the development of the computer , there is no memory function fully meet the needs of the memory of a computer system. Therefore, the computer system u

8、sually equipped with a layered structure of storage system, to satisfy the capacity, speed and cost requirements.Measure memory has three index : capacity , speed and price/a. Generally speaking , the high speed of memory, every price is high , therefore capacity can not be too big . So memory desig

9、n constraints capacity , speed and price . There seems to be no limit capacity , no matter how much capacity , the total to develop applications to use . In order to obtain the better performance, the speed of the memory must be able to keep up with the CPU,and that is when the CPU executing instruc

10、tions , dont want him to stop and wait for instructions or operand. The question of price must also consider, for practical system, memory prices relative to other parts must be is reasonable. So the three indexes to weigh between.Cache system can ensure cache memory and main memory contents consist

11、ency , the directly related to the entire computer system performance . The two parts of the data consistency issues of two reasons : first , because of the CPU cache memory write led to its contents to update the memory and out-of-date contents ; Second , because of I/O processor or multi-processor

12、 systems of a processor modified the main memory contents lead to cache content obsolete . According to different reasons , analyzes the strategy of written seven kinds of solutions, and the cache system USES 2 to take off the piece of cache, and the third class to take off the piece of cache struct

13、ure data consistency problem for a preliminary discussion.This article through to the memory system Cache ( Cache ) and the concept of main storage describe between consistency and at present there are some problems. And analysis in multiprocessor system , main memory with the processor Cache betwee

14、n the private and private Cache of inconsistency between data. To solve the inconsistency method: surveillance bus agreement, the Cache directory based on consistency agreement, software control method of detailed qualitative analysis , and points out the advantages and disadvantages of each method

15、for designers ; Some software and hardware the method of combining the Cache can effectively resolve the consistency of the problem.Key Words: Memory , The main memory , Cache , The consistencyIV目 录1 引 言 .12 研 究 的 背 景 和 意 义 .22.1 研 究 的 背 景 .22.1.1 主 -辅 存 存 储 层 次 22.1.2 CACHE-主 存 存 储 层 次 .32.1.3 存 储

16、器 分 层 结 构 .32.2 研 究 的 意 义 .53 数 据 一 致 性 问 题 的 提 出 .74 基 于 不 同 原 因 的 写 策 略 解 决 方 案 .94.1 基 于 原 因 1 的 解 决 办 法 .94.1.1 写 直 达 .94.1.2 写 回 发 .94.2 基 于 原 因 2 的 解 决 办 法 .94.2.1 总 线 监 视 法 .94.2.2 硬 件 监 视 法 104.2.3 划 出 不 可 高 速 缓 存 存 储 区 法 104.2.4 CACHE 清 除 法 .104.3 基 于 原 因 3 的 解 决 办 法 104.4 基 于 目 录 的 CACHE 一

17、 致 性 协 议 105 数 据 一 致 性 问 题 的 发 展 与 展 望 136 结 束 语 15参 考 文 献 16致 谢 1811 引 言高 速 缓 冲 存 储 器 是 存 在 于 主 存 与 CPU 之 间 的 一 级 存 储 器 , 由 静 态 存 储 芯 片(SRAM)组 成 , 容 量 比 较 小 但 速 度 比 主 存 高 得 多 , 接 近 于 CPU 的 速 度 。 在 计 算 机 存储 系 统 的 层 次 结 构 中 , 是 介 于 中 央 处 理 器 和 主 存 储 器 之 间 的 高 速 小 容 量 存 储 器 。 它和 主 存 储 器 一 起 构 成 一 级 的

18、存 储 器 。 高 速 缓 冲 存 储 器 和 主 存 储 器 之 间 信 息 的 调 度 和传 送 是 由 硬 件 自 动 进 行 的 。高 速 缓 冲 存 储 器 的 容 量 一 般 只 有 主 存 储 器 的 几 百 分 之 一 , 但 它 的 存 取 速 度 能 与中 央 处 理 器 相 匹 配 。 根 据 程 序 局 部 性 原 理 , 正 在 使 用 的 主 存 储 器 某 一 单 元 邻 近 的 那些 单 元 将 被 用 到 的 可 能 性 很 大 。 因 而 , 当 中 央 处 理 器 存 取 主 存 储 器 某 一 单 元 时 , 计算 机 硬 件 就 自 动 地 将 包 括

19、 该 单 元 在 内 的 那 一 组 单 元 内 容 调 入 高 速 缓 冲 存 储 器 , 中 央处 理 器 即 将 存 取 的 主 存 储 器 单 元 很 可 能 就 在 刚 刚 调 入 到 高 速 缓 冲 存 储 器 的 那 一 组 单元 内 。 于 是 , 中 央 处 理 器 就 可 以 直 接 对 高 速 缓 冲 存 储 器 进 行 存 取 。 在 整 个 处 理 过 程中 , 如 果 中 央 处 理 器 绝 大 多 数 存 取 主 存 储 器 的 操 作 能 为 存 取 高 速 缓 冲 存 储 器 所 代 替 ,计 算 机 系 统 处 理 速 度 就 能 显 著 提 高 。当 然

20、, 计 算 机 存 储 系 统 中 , 高 速 缓 冲 存 储 器 系 统 的 引 入 虽 然 为 计 算 机 系 统 处 理数 据 的 速 度 带 来 了 显 著 地 提 高 , 但 是 随 之 而 来 的 Cache( 高 速 缓 存 ) 与 主 存 间 数 据一 致 性 问 题 也 是 日 益 凸 显 出 来 。存 储 器 中 的 一 致 性 问 题 , 是 伴 随 着 存 储 器 结 构 的 概 念 而 提 出 的 , 又 一 直 是 困 扰 着 计算 机 设 计 者 的 一 个 重 要 问 题 , 也 是 很 多 从 事 计 算 机 体 系 结 构 研 究 的 人 们 所 共 同 面

21、 对 的 一个 热 门 研 究 课 题 。 特 别 是 近 年 来 出 现 的 多 处 理 系 统 , 超 并 行 机 系 统 , 超 大 规 模 计 算 机 系统 等 采 用 DSM( Distributed Shared Memory) -分 布 式 共 享 存 储 器 技 术 的 大 型 系 统 中 ,都 采 用 了 多 级 Cache 的 存 储 器 层 次 结 构 。 在 Cache 的 数 据 一 致 性 问 题 上 , 就 更 显 突 出 了 。如 在 DSM 多 处 理 机 系 统 结 构 中 , 相 邻 层 之 间 和 同 一 层 之 内 可 能 会 出 现 数 据 不 一

22、致 性 。 通过 存 储 器 的 共 享 数 据 , 进 程 在 同 一 算 法 下 并 行 工 作 。 为 了 减 少 内 存 访 问 延 时 和 内 存 总 线的 拥 塞 , 要 求 Cache 与 每 个 处 理 器 相 关 。 这 样 同 一 数 据 在 不 同 的 Cache 中 有 多 个 副 本 。当 处 理 机 对 共 享 存 储 器 某 个 单 元 在 其 本 地 Cache 中 的 拷 贝 要 进 行 维 护 时 , 只 要 对 该 单 元的 本 地 拷 贝 进 行 修 改 , 这 就 有 可 能 引 起 存 储 器 的 全 局 不 一 致 性 等 等 。 所 以 如 何

23、在 维 护 一致 性 情 况 下 又 保 证 处 理 机 代 价 最 小 是 这 本 论 文 讨 论 的 主 要 问 题 。本 文 将 在 对 计 算 机 存 储 系 统 存 储 进 行 介 绍 的 前 提 下 , 对 高 速 缓 存 系 统 中 Cache( 高速 缓 存 ) 与 主 存 这 两 部 分 的 数 据 一 致 性 问 题 产 生 的 各 种 原 因 进 行 充 分 的 分 析 和 研 究 , 并针 对 不 同 的 原 因 , 给 予 适 当 各 种 维 护 策 略 下 的 保 证 一 致 性 的 可 行 方 案 。22 研 究 的 背 景 和 意 义2.1 研 究 的 背 景存

24、 储 器 是 具 有 “记 忆 ”功 能 的 部 件 , 它 在 计 算 机 系 统 中 占 有 十 分 重 要 的 地 位 。存 储 器 的 基 本 功 能 是 存 放 以 二 进 制 形 式 表 示 的 程 序 与 数 据 。 如 何 设 计 容 量 大 、 速 度快 且 造 价 低 的 存 储 器 , 一 直 是 计 算 机 发 展 中 的 关 键 问 题 , 目 前 还 没 有 哪 一 种 存 储 器功 能 完 全 满 足 计 算 机 系 统 对 存 储 器 的 需 求 。 因 此 , 计 算 机 系 统 通 常 配 备 分 层 结 构 的存 储 系 统 , 以 满 足 容 量 、 速

25、 度 和 造 价 等 方 面 的 要 求 。衡 量 存 储 器 有 三 个 指 标 : 容 量 、 速 度 和 价 格 /位 。 一 般 地 说 , 速 度 高 的 存 储 器 ,每 位 价 格 也 高 , 因 此 容 量 不 能 太 大 。 所 以 存 储 器 设 计 的 约 束 有 容 量 、 速 度 和 价 格 。容 量 似 乎 没 有 限 制 , 不 管 容 量 多 大 , 总 要 开 发 出 应 用 程 序 来 使 用 。 为 了 获 得 更 好 的性 能 , 存 储 器 的 速 度 必 须 能 够 跟 上 CPU, 即 当 CPU 执 行 指 令 时 , 不 想 让 他 停 下 来

26、 等待 指 令 或 操 作 数 。 价 格 问 题 也 必 须 考 虑 , 对 于 实 用 的 系 统 , 存 储 器 的 价 格 必 须 相 对于 其 他 部 件 是 合 理 的 。 因 此 三 个 指 标 之 间 需 要 进 行 权 衡 。2.1.1 主-辅存存储层次由 于 计 算 机 主 存 容 量 相 对 于 程 序 员 所 需 要 的 容 量 来 说 总 是 太 小 , 程 序 与 数 据 从辅 存 调 入 主 存 是 由 程 序 员 自 己 安 排 的 , 程 序 员 必 须 花 费 很 大 精 力 和 时 间 把 大 程 序 预先 分 成 块 , 确 定 好 这 些 程 序 块

27、在 辅 存 中 的 位 置 和 装 入 主 存 的 地 址 , 而 且 还 要 预 先 安排 好 程 序 运 行 时 各 块 如 何 和 何 时 调 入 调 出 , 因 此 存 在 存 储 空 间 的 分 配 问 题 。 操 作 系统 的 形 成 和 发 展 使 得 程 序 员 尽 可 能 摆 脱 主 、 辅 存 之 间 的 地 址 定 位 , 同 时 形 成 了 支 持这 些 功 能 的 “辅 助 硬 件 ”, 通 过 软 件 、 硬 件 的 结 合 , 把 主 存 和 辅 存 统 一 成 了 一 个 整体 , 如 图 2-1 所 示 。 这 时 , 由 主 存 、 辅 存 形 成 了 一

28、个 存 储 层 次 , 即 存 储 系 统 。 从 整体 看 , 其 速 度 接 近 于 主 存 的 速 度 , 其 容 量 则 接 近 于 辅 存 的 容 量 , 而 每 位 的 平 均 价 格也 接 近 于 廉 价 的 慢 速 的 辅 存 平 均 价 格 。 这 种 系 统 不 断 发 展 和 完 善 , 就 逐 步 形 成 了 现在 广 泛 使 用 的 虚 拟 存 储 系 统 。 在 系 统 中 , 应 用 程 序 员 可 用 机 器 指 令 地 址 码 对 整 个 程序 统 一 编 址 , 如 同 程 序 员 具 有 对 应 这 个 地 址 码 宽 度 的 全 部 虚 存 空 间 一

29、样 。 该 空 间 可以 比 主 存 实 际 空 间 大 得 多 , 以 致 可 以 存 得 下 整 个 程 序 。 这 种 指 令 地 址 码 称 为 虚 地 址( 虚 存 地 址 、 虚 拟 地 址 ) 或 逻 辑 地 址 , 其 对 应 的 存 储 容 量 称 为 虚 存 容 量 或 虚 存 空 间 ;而 把 实 际 主 存 的 地 址 称 为 物 理 地 址 、 实 ( 存 ) 地 址 , 其 对 应 的 存 储 容 量 称 为 主 存 容量 、 实 存 容 量 或 实 ( 主 ) 存 空 间 。3图 2-1 主 -辅 存 存 储 层 次2.1.2 CACHE-主存存储层次当 用 虚

30、地 址 访 问 主 存 时 , 机 器 自 动 地 把 它 经 辅 助 软 件 、 硬 件 变 换 成 主 存 实 地 址 。察 看 这 个 地 址 所 对 应 的 单 元 内 容 是 否 已 经 装 入 主 存 , 如 果 在 主 存 就 进 行 访 问 , 如 果不 在 主 存 内 就 经 辅 助 软 件 、 硬 件 把 它 所 在 的 那 块 程 序 和 数 据 由 辅 存 调 入 主 存 , 而 后进 行 访 问 。 这 些 操 作 都 不 必 由 程 序 员 来 安 排 , 也 就 是 说 , 对 应 用 程 员 员 是 透 明 的 。主 -辅 存 层 次 解 决 了 存 储 器 大

31、 容 量 要 求 和 低 成 本 之 间 的 矛 盾 。在 速 度 方 面 , 计 算 机 的 主 存 和 CPU 直 保 持 了 大 约 一 个 数 量 级 的 差 距 。 显 然 这 个差 距 限 制 了 CPU 速 度 潜 力 的 发 挥 。 为 了 弥 合 这 个 差 距 , 仅 采 用 一 种 工 艺 的 单 一 存 储器 是 行 不 通 的 , 必 须 进 一 步 从 计 算 机 系 统 结 构 和 组 织 上 去 研 究 。 设 置 高 速 缓 冲 存 储器 ( Cache) 是 解 决 存 取 速 度 的 重 要 方 法 。 在 CPU 和 主 存 中 间 设 置 高 速 缓

32、冲 存 储 器 ,构 成 高 速 缓 存 ( Cache) -主 存 层 次 , 要 求 Cache 在 速 度 上 能 跟 得 上 CPU 的 要 求 。Cache-主 存 间 的 地 址 映 象 和 调 度 吸 取 了 比 它 较 早 出 现 的 主 -辅 存 存 储 层 次 的 技 术 ,不 同 的 是 因 其 速 度 要 求 高 , 不 是 由 软 、 硬 件 结 合 而 完 全 由 硬 件 来 实 现 , 如 图 2-2 所示 。图 2-2 Cache-主 存 存 储 层 次2.1.3 存储器分层结构从 CPU 的 角 度 看 , Cache-主 存 层 次 的 速 度 接 近 于

33、Cache, 容 量 与 每 位 价 格 接 近于 主 存 , 因 此 , 解 决 了 速 度 与 成 本 之 间 的 矛 盾 。4综 上 所 述 , 计 算 机 的 存 储 系 统 是 采 用 了 存 储 器 的 分 层 结 构 , 而 不 只 是 依 赖 单 一的 存 储 部 件 或 技 术 。 图 2-3 给 出 了 一 个 通 用 分 层 结 构 , 图 中 从 上 到 下 出 现 情 况 如 下 :1每 位 的 价 格 降 低 ;2容 量 增 大 ;3存 取 时 间 增 大 ;4CPU 存 取 存 储 器 的 频 度 降 低 。图 2-3 存 储 器 分 层 结 构因 此 , 较 小

34、 、 较 贵 、 较 快 的 存 储 器 可 作 为 较 大 、 较 便 宜 、 较 慢 的 存 储 器 的 补 充 。这 个 结 构 成 功 的 关 键 是 最 后 一 项 , 即 存 取 频 度 降 低 。如 果 能 够 根 据 以 上 的 1到 3项 来 组 织 存 储 器 , 而 且 数 据 和 指 令 能 够 根 据 4分布 在 存 储 器 中 , 很 显 然 , 这 个 方 案 在 保 证 给 定 的 性 能 水 平 的 情 况 下 能 降 低 总 体 价 格 。下 面 用 一 个 简 单 的 例 子 来 说 明 这 一 点 。假 设 CPU 能 够 存 取 二 级 的 存 储 器

35、 , 第 1 级 包 含 1000 个 字 并 有 1 微 秒 的 存 取 时间 , 第 2 级 包 含 1000000 个 字 并 有 10 微 秒 的 存 取 时 间 。 假 设 要 存 取 的 一 个 字 在 第1 级 , 那 么 CPU 能 直 接 存 取 它 ; 假 设 它 在 第 2 级 , 则 这 个 字 首 先 传 到 第 1 级 , 然 后再 由 CPU 存 取 它 。 为 了 简 化 , 不 考 虑 CPU 确 定 这 个 字 在 第 1 级 还 是 在 第 2 级 所 需 的时 间 。 图 2-4 表 示 了 平 均 总 存 取 时 间 和 在 第 1 级 中 存 取 字

36、 所 需 的 时 间 占 总 的 百 分 比的 函 数 关 系 。 可 见 , 第 1 级 存 取 百 分 比 高 时 , 平 均 总 的 存 取 时 间 接 近 于 第 1 级 的 存取 时 间 。 此 例 说 明 了 这 种 策 略 工 作 的 原 理 。 如 果 条 件 1到 4都 满 足 , 则 它 能 工 作 。5图 2-4 简 单 的 两 级 存 储 性 能条 件 4有 效 的 基 础 是 访 问 局 部 性 原 理 。 在 程 序 执 行 过 程 中 , 处 理 器 访 问 存 储 器中 的 指 令 和 数 据 倾 向 于 成 块 进 行 。 程 序 通 常 包 含 许 多 迭

37、代 循 环 的 子 程 序 , 一 旦 进 入了 一 个 循 环 或 子 程 序 , 则 需 重 复 访 问 一 小 组 指 令 。 同 样 , 对 于 表 和 数 组 的 操 作 , 包含 存 取 一 块 块 的 数 据 字 。 在 一 长 段 时 间 内 , 使 用 的 块 是 变 化 的 , 而 在 一 小 段 时 间 内 ,处 理 器 主 要 访 问 存 储 器 中 的 固 定 块 。因 此 , 通 过 分 层 结 构 组 织 数 据 , 有 可 能 使 存 取 较 低 层 的 存 取 时 间 百 分 比 低 于 存取 高 层 的 百 分 比 。 根 据 上 面 给 出 的 二 级 例

38、 子 , 让 第 2 级 的 存 储 器 包 含 所 有 程 序 的 指令 和 数 据 , 当 前 的 块 临 时 放 在 第 1 级 , 第 1 级 某 些 块 回 不 时 地 交 换 回 第 2 级 。 然 而 ,多 数 是 对 第 1 级 中 的 指 令 和 数 据 的 访 问 。这 个 原 理 可 以 应 用 到 两 级 以 上 的 存 储 器 。 考 虑 如 图 2-3 所 示 的 分 层 结 构 , 最 快 、最 小 和 最 贵 的 存 储 器 是 处 理 器 的 内 部 存 储 器 。 通 常 一 个 处 理 器 包 含 几 十 个 寄 存 器 ,虽 然 有 些 机 器 包 含

39、几 百 个 寄 存 器 。 向 下 跳 二 层 是 主 存 储 器 。 主 存 储 器 通 常 用 一 个 速度 更 快 、 容 量 更 小 的 高 速 缓 存 来 扩 充 。 高 速 缓 存 是 透 明 的 , 它 在 主 存 和 处 理 器 寄 存器 之 间 传 送 数 据 以 提 高 性 能 。2.2 研 究 的 意 义高 速 缓 冲 存 储 器 是 存 在 于 主 存 与 CPU 之 间 的 一 级 存 储 器 , 由 静 态 存 储 芯 片(SRAM)组 成 , 容 量 比 较 小 但 速 度 比 主 存 高 得 多 , 接 近 于 CPU 的 速 度 。 在 计 算 机 存储 系

40、统 的 层 次 结 构 中 , 介 于 中 央 处 理 器 和 主 存 储 器 之 间 的 高 速 小 容 量 存 储 器 。 它 和主 存 储 器 一 起 构 成 一 级 的 存 储 器 。 高 速 缓 冲 存 储 器 和 主 存 储 器 之 间 信 息 的 调 度 和 传送 是 由 硬 件 自 动 进 行 的 。6高 速 缓 冲 存 储 器 的 容 量 一 般 只 有 主 存 储 器 的 几 百 分 之 一 , 但 它 的 存 取 速 度 能 与中 央 处 理 器 相 匹 配 。 根 据 程 序 局 部 性 原 理 , 正 在 使 用 的 主 存 储 器 某 一 单 元 邻 近 的 那些

41、单 元 将 被 用 到 的 可 能 性 很 大 。 因 而 , 当 中 央 处 理 器 存 取 主 存 储 器 某 一 单 元 时 , 计算 机 硬 件 就 自 动 地 将 包 括 该 单 元 在 内 的 那 一 组 单 元 内 容 调 入 高 速 缓 冲 存 储 器 , 中 央处 理 器 即 将 存 取 的 主 存 储 器 单 元 很 可 能 就 在 刚 刚 调 入 到 高 速 缓 冲 存 储 器 的 那 一 组 单元 内 。 于 是 , 中 央 处 理 器 就 可 以 直 接 对 高 速 缓 冲 存 储 器 进 行 存 取 。 在 整 个 处 理 过 程中 , 如 果 中 央 处 理 器

42、绝 大 多 数 存 取 主 存 储 器 的 操 作 能 为 存 取 高 速 缓 冲 存 储 器 所 代 替 ,计 算 机 系 统 处 理 速 度 就 能 显 著 提 高 。在 由 主 存 和 高 速 缓 存 组 成 的 存 储 器 层 次 结 构 中 , 主 存 是 多 处 理 机 共 享 , 而 高 速缓 存 是 每 个 处 理 机 私 有 的 。 主 存 和 高 速 缓 存 都 以 块 为 单 位 进 行 划 分 , 以 映 射 的 方 式来 检 索 。 映 射 的 方 法 有 直 接 映 射 、 组 关 联 映 射 、 区 段 关 联 映 射 和 全 相 联 映 射 。 在 主存 和 高

43、 速 缓 存 之 间 , 是 以 块 为 单 位 进 行 搬 送 。 主 存 中 保 存 有 各 高 速 缓 存 的 副 本 , 高速 缓 存 的 目 录 中 , 存 放 相 应 主 存 的 块 号 及 一 些 标 志 。 通 过 对 目 录 的 检 索 来 寻 找 高 速缓 存 中 的 数 据 。 当 处 理 机 发 出 一 个 访 问 主 存 地 址 时 , 如 果 包 含 这 个 地 址 在 内 的 模 块在 高 速 缓 存 中 , 则 称 之 为 命 中 , 该 高 速 缓 存 可 以 使 用 。 如 果 不 在 高 速 缓 存 中 , 则 称之 为 未 命 中 ( 或 Cache 失

44、 效 ) , 这 时 , 必 须 把 这 个 模 块 从 主 存 搬 到 高 速 缓 存 中 , 叫做 块 搬 送 。 如 果 高 速 缓 存 已 满 , 则 必 须 按 一 定 的 置 换 算 法 挑 出 一 个 模 块 搬 出 高 速 缓存 到 主 存 , 这 叫 置 换 。 置 换 算 法 有 FIFO 算 法 , URL 算 法 等 。计 算 机 高 速 缓 存 系 统 的 发 展 为 计 算 机 设 计 者 提 出 了 一 个 重 要 课 题 : 数 据 在Cache( 高 速 缓 冲 存 储 器 ) 和 主 存 之 间 交 换 时 必 须 满 足 数 据 一 致 的 要 求 , 随

45、 着 多 任务 系 统 的 采 用 , 数 据 一 致 性 问 题 越 来 越 突 出 , 以 往 关 于 这 方 面 的 著 述 具 有 了 很 大 的局 限 性 , 例 如 , 对 于 486 以 上 机 种 出 现 的 第 二 级 托 片 Cache、 第 三 级 托 片 Cache 如何 保 存 数 据 一 致 的 问 题 尚 未 见 于 专 门 的 论 述 。 为 了 探 索 更 适 合 于 当 前 计 算 机 发 展 的趋 势 , 必 须 适 时 追 溯 数 据 一 致 性 问 题 出 现 和 发 展 的 历 史 轨 迹 , 步 入 多 任 务 系 统 的 解决 方 案 。因 此

46、高 速 缓 存 系 统 中 能 否 确 保 高 速 缓 冲 存 储 器 和 主 存 内 容 一 致 性 , 这 个 问 题 直接 关 系 到 整 个 计 算 机 系 统 的 性 能 。 对 于 计 算 机 整 体 性 能 的 提 升 有 十 分 重 要 的 意 义 。73 数 据 一 致 性 问 题 的 提 出高 速 缓 存 是 旨 在 改 善 存 储 器 平 均 响 应 时 间 的 小 型 快 速 存 储 器 , 它 在 系 统 中 位 于 微 处理 器 和 主 存 之 间 , 使 得 系 统 从 CPU 看 具 有 Cache 的 速 度 , 主 存 的 容 量 。 图 3-1 为 一 高

47、 速缓 冲 存 储 器 系 统 框 图 , 它 将 微 处 理 器 频 繁 向 主 存 请 求 的 代 码 和 数 据 予 以 拷 贝 。图 3-1 高 速 缓 存 框 图Cachc 的 操 作 与 存 储 器 一 样 具 有 读 /写 两 种 模 式 , 其 中 读 操 作 主 要 局 限 在 不 命 中 时更 新 Cache 内 容 , 只 影 响 存 储 系 统 工 作 速 度 。 写 操 作 不 仅 工 作 时 间 比 读 操 作 长 , 而 且 更新 主 存 内 容 , 直 接 影 响 机 器 性 能 , 据 李 学 干 、 苏 东 庄 在 计 算 机 系 统 结 构 一 书 中 借

48、 典型 程 序 的 统 计 可 知 , 所 有 访 存 中 约 有 10%34%甚 至 更 多 的 是 写 操 作 。 写 操 作 是 直 接 导 致数 据 一 致 性 问 题 产 生 的 原 因 。在 一 个 系 统 中 , 同 一 个 数 据 的 多 个 拷 贝 可 以 同 时 存 在 , 如 果 一 个 拷 贝 改 变 了 而 其 它的 没 变 , 那 么 两 组 不 同 的 数 据 便 与 主 存 的 同 一 地 址 有 关 。 Cache 必 须 包 含 一 个 更 新 系 统以 防 止 老 数 据 (陈 旧 数 据 )被 使 用 , 即 解 决 一 致 性 问 题 。 分 析 产

49、生 数 据 一 致 性 问 题 的 原 因主 要 有 三 个 :1 同 样 一 个 数 据 可 能 既 存 于 Cache 中 , 也 存 于 主 存 中 , 这 样 可 能 前 者 己 更 新 , 后者 未 更 新 , 造 成 数 据 丢 失 。2 在 有 DMA 系 统 或 多 处 理 器 系 统 中 , 有 多 个 部 件 可 以 访 问 主 存 , 这 时 可 能 其 中 有些 部 件 是 直 接 访 问 主 存 , 也 可 能 每 个 DMA 部 件 和 每 个 处 理 器 配 一 个 Cache, 这 样 主 存 的一 块 区 域 可 能 对 应 于 多 个 Cache 中 的 各 1 个 块 区 , 产 生 主 存 中 的 数 据 被 某 个 总 线 主 控 部件 更 新 过 , 而 某 个 Cache 中 的 内 容 未 更 新 , 造 成 Cache 中 数 据 过 时 。3 当 主 存 中 同 时 有 多 道 程 序 运 行 时 , Cache 中 均 有 相 应 的 数 据 副 本 与 每 道 程 序 相对 应 ; 对 于 共 享 数 据 , 每 道 程 序 都 有 各 自 的 Cache 数 据 与 主 存 数 据 相 一 致 。 当 某 道 更 新8了 其 相 应 的 Cache 数 据 和 主 存 数 据 , 而 其

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报