收藏 分享(赏)

第6章向量处理机-1.ppt

上传人:j35w19 文档编号:12274530 上传时间:2021-12-08 格式:PPT 页数:38 大小:186.50KB
下载 相关 举报
第6章向量处理机-1.ppt_第1页
第1页 / 共38页
第6章向量处理机-1.ppt_第2页
第2页 / 共38页
第6章向量处理机-1.ppt_第3页
第3页 / 共38页
第6章向量处理机-1.ppt_第4页
第4页 / 共38页
第6章向量处理机-1.ppt_第5页
第5页 / 共38页
点击查看更多>>
资源描述

1、6 1向量数据表示方式6 2向量处理方式6 3向量处理机的关键技术6 4向量处理机实例 向量处理机 具有向量数据表示和向量指令系统的处理机向量处理机是解决数值计算问题的一种高性能计算机向量处理机属大型或巨型机 也可以用微机加一台向量协处理器组成向量处理机一般都采用流水线结构 通常有有多条并行工作的流水线必须把要解决的问题转化为向量运算 才能发挥向量处理机的效率 6 向量数据表示方式 6 1 1从标量到向量6 1 2等间距向量表示法6 1 3带位移量的向量表示法6 1 4稀疏向量表示法 例6 1 一个简单的C语言程序如下 for i 10 i 1010 i c i a i b i 5 在向量处理

2、机上 可以只用一条指令 C 10 1010 A 10 1010 B 15 1015 一条向量指令可处理 个或 对操作数在标量处理机上用10多条指令 其中有8条指令要循环1000次 采用多寄存器结构的两地址指令编写程序存储器采用字节编址方式 字长为32位 6 1 1从标量到向量 在一般标量处理机中需要如下指令序列来实现 A B C分别是向量a b c在内存中的起始地址 START LOADR0 ST 读循环初值10LOADR1 ED 读循环终值1010LOADR2 L 读内存地址增量MOVER3 R2MULR3 R0 计算向量偏移量 初始值为40LOOP LOADR4 A R3 读A向量的一个元

3、素 LOADR5 B R3 读B向量的一个元素ADDR4 R5 加一个元素STORER4 C R3 写C向量的一个元素ADDR3 R2 改变向量偏移量INCR0 循环次数增1CMPR0 R1 循环是否结束BLELOOP 循环未结束转LOOP 否则继续HALT 停机ST 10 循环初值ED 1010 循环终值L 4 内存地址增量 例6 1 一个简单的C语言程序如下 for i 10 i 1010 i c i a i b i 5 在向量处理机上 可以只用一条指令 C 10 1010 A 10 1010 B 15 1015 6 1 1从标量到向量 三个参数表示一个等间距向量 向量起始地址 A向量长度

4、 L向量间距 f 6 1 2等间距向量表示法 例如 我国研制的银河向量机 有8个向量寄存器V0 V7 每个向量寄存器由64个64位的寄存器组成 存储器字长64位 采用字节编址方式 则连续向量的间距为f 100 向量指令采用三地址形式 例如 Vi VjOPVk 向量长度 VL 50 则实际完成的运算是 V3 00 V3 49与V5 00 V5 49分别相加 结果放在V1 00 V1 49中 6 1 3带位移量的向量表示法 用三个参数表示一个向量 向量基地址 A向量长度 L向量位移量 f向量有效长度 L f向量起始地址 A f优点 每个向量可以带有位移 能够通过控制向量实现可变增量 能够表示稀疏向

5、量 带位移量的向量表示法 6 1 4稀疏向量表示法 定义 0元素很多 非0元素很少的向量称为稀疏向量采用压缩方法存储稀疏向量可以节省存储空间 可以还原之后进行运算 也可以用压缩方法直接进行运算 有三种处理方式 横向处理方式 又称为水平处理方式 横向加工方式等 向量计算是按行的方式从左至右横向地进行 纵向处理方式 又称为垂直处理方式 纵向加工方式等 向量计算是按列的方式自上而下纵向地进行 纵横处理方式 又称为分组处理方式 纵横向加工方式等 横向处理和纵向处理相结合的方式 6 2向量处理方式 要根据向量运算的特点和向量处理机的类型选择向量的处理方式 以一个简单的C语言编写的程序为例 说明向量的三种

6、处理方式的工作原理 for i 1 i n i y i a i b i c i 1 横向处理方式也称为水平处理方式 横向加工方式等逐个分量进行处理 假设中间结果为T I 计算第1个分量 T 1 B 1 C 1 Y 1 A 1 T 1 计算第2个分量 T 2 B 2 C 2 Y 2 A 2 T 2 计算最后一个分量 T N B N C N Y N A N T N 存在两个问题 在计算向量的每个分量时 都发生写读数据相关 流水线效率低如果采用多功能流水线 必须频繁进行流水线切换横向处理方式对向量处理机不适合即使在标量处理机中 也经常通过编译器进行指令流调度 2 纵向处理方式也称为垂直处理方式 纵向

7、加工方式等T 1 B 1 C 1 T 2 B 2 C 2 T n B n C n Y 1 A 1 T 1 Y 2 A 2 T 2 Y N A N T N 采用向量指令只需要2条 VADDB C TVMULA T Y这种处理方式适用于向量处理机数据相关不影响流水线连续工作 不同的运算操作只需要切换1次 这种处理方式适用于存储器 存储器结构 3 纵横处理方式用于寄存器 寄存器结构的向量处理机中 向量寄存器的长度是有限的 当向量长度N大于向量寄存器长度n时 需要分组处理 分组方法 其中 为余数 共分 组 组内采用纵向处理方式 组间采用横向处理方式 因此 也称为分组处理方式 纵横向加工方式等 运算过程

8、为 第 组 T 1 n B 1 n C 1 n Y 1 n A 1 n T 1 n 第 组 T n 1 2n B n 1 2n C n 1 2n Y n 1 2n A n 1 2n T n 1 2n 最后第k 1组 T kn 1 N B kn 1 N C kn 1 N Y kn 1 N A kn 1 N T kn 1 N 每组用两条向量指令 每组发生相关两次 其中组内发生数据相关一次 组间切换时发生相关一次 主要优点 减少访问主存储器的次数例如 中间变量T不写入主存储器 实际的应用问题中通常既有向量计算又有标量计算 而且两类计算有一定的比例向量平衡点 vectorbalancepoint 为了

9、使向量硬件设备和标量硬件设备的利用率相等 一个程序中向量代码所占的百分比 关键问题是 希望向量硬件和标量硬件都能够充分利用 不要空闲 6 3向量处理机的关键技术6 3 1向量与标量性能的平衡 例如 一个系统的向量运算速度为90Mfolps 标量运算速度为10Mfolps 如果程序的90 是向量运算 10 是标量运算 则向量平衡点为0 9 硬件利用率最高 向量处理机的向量平衡点必须与用户程序的向量化程度相匹配 IBM向量计算机的设计思想与上述方法不同 它维持较低的向量与标量比例 定在3 5的范围之间 这种做法能够适应通用应用问题对标量和向量处理要求 机器型号 几种超级计算机的向量性能和标量性能

10、FujitsuVP400 CrayIS Cray2S CrayX MP CrayY MP HitachiS820 NECSX2 向量性能Mflops 标量性能Mflops 向量平衡点 85 0 9 8 0 90 151 5 11 2 0 93 143 3 13 1 0 92 201 6 17 0 0 92 737 3 17 8 0 98 424 2 9 5 0 98 207 1 6 6 0 97 指令格式 相关和冲突 向量指令的类型以CRAY 1向量处理机为例 有四类指令 两种指令格式 1 向量与向量操作 Vi VjOPVk 2 向量与标量操作 Vi SjOPVk 3 向量取 Vi 存储器 4

11、 向量存 存储器 Vi 一种向量处理机的指令格式 向量运算中的相关和冲突向量运算中的数据相关和功能部件冲突 采用顺序发射顺序完成方式 1 写读数据相关 2 读读数据相关 或向量寄存器冲突 3 运算部件冲突 V0 V1 V2V0 V1 V2V3 V4 V5V3 V0 V4 a 不相关的指令 b 写读数据相关 V0 V1 V2V0 V1 V2V3 V4 V5V3 V1 V4 c 功能部件冲突 d 读读数据相关相关处理向量相关时候的处理比较复杂 涉及到专业的体系结构知识和优化调度算法 有兴趣的同学可以参照相关文献 在此不做课程内容 向量处理机主要出自美国和日本 美国著名的向量计算机公司有 CRAYC

12、DCTI等日本公司有 NECFujitsuHitachi等 6 4典型的向量处理机 机器型号 美国和日本制造的向量处理机 CrayIS 配置 特点 有10条流水线的单处理机 12 5ns COS CF72 1 第一台基于ECL的超级计算机 1976年问世 典型向量处理机 Cray2S 4 256 256M字存储器的4台处理机 4 lns COS或UNIX CF773 0 16K字的本地存储器 移植了UNIXV 1985问世 机器型号 CrayX MP416 配置 特点 16M字存储器的4台处理机 128M字SSD 8 5ns COSCF775 0 使用共享寄存器组用于IPC 1983年问世 C

13、rayY MP832 128M字存储器的8台处理机 6ns CF775 0 X MP的改进型 1988年问世 每台处理机2条向量流水线 16台处理机 4 2ns Unicos CF775 0 CrayY MPC 90 最大的Cray机器1991年问世 机器型号 CDCCyber205 配置 特点 有4条流水线的单处理机 20ns 虚拟OS FTN200 存储器到存储器系统结构 1982年问世 ETA10E 单处理机 10 5ns ETAV FTN200 Cyber205的后继型号 1985年问世 每台处理机4组流水线 4台处理机 2 9ns F77SX 22Gflops NECSX X 44 1991年问世 机器型号 FujitsuVP2600 10 配置 特点 5条流水线的单处理机和双标量处理机 3 2ns MSP EX F77EX VP 使用可重构微向量寄存器和屏蔽 1991年问世 512MB存储器 18条流水线的单处理机 4ns FORT77 HAPV23 OC Hitachi820 80 64个通道 最大传输速率288MB S 1988年问世 从向量到标量 本章重点 1 向量的表示方法2 向量与标量性能的平衡概念

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报