ImageVerifierCode 换一换
格式:DOC , 页数:43 ,大小:72.56KB ,
资源ID:1523825      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-1523825.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(同步数据触发体系结构多核处理器存储系统关键技术研究.doc)为本站会员(cjc2202537)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

同步数据触发体系结构多核处理器存储系统关键技术研究.doc

1、计算机科学与技术专业毕业论文 精品论文 同步数据触发体系结构多核处理器存储系统关键技术研究关键词:多核处理器 存储系统 同步数据触发体系结构 评估模型 优化设计摘要:采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理

2、器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎

3、。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同

4、步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2C

5、ache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供

6、有针对性的有效存储结构。正文内容采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层

7、次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成

8、为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,

9、不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能

10、相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储

11、墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排

12、队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据

13、预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。

14、(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针

15、对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchi

16、tecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理

17、器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 C

18、ache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基

19、于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指

20、令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研

21、究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送

22、技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多

23、核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时

24、向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储

25、器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生

26、产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传

27、输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。

28、该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,

29、性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,

30、对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求

31、处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分

32、析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享

33、Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相

34、应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDa

35、taTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数

36、对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技

37、术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有

38、所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L

39、2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存

40、储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出

41、了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理

42、器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理

43、器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成

44、 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处

45、理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数

46、据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令 Cache 作废的多核同步技术。(1)针对典型的基于共享 Cache 结构下的锁同步操作涉及到资源竞争、Cache 一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用 SDTA 结构特性可以将同步功能单元方便的连入计算核

47、中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享 Cache 结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令 Cache 作废的多核同步技术,通过作废将要执行的指令 Cache 行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向 L2Cache 发取指请求,在L2Cache 中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。

48、测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令 Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2Cache 替换算法,并设计了 L2Cache,支持所提出的基于指令 Cache 作废的同步技术;设计了一种可配置的数据 Cache,既可以配置成数据 Cache,也可以配置成 Scratchpad 局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。采用多核体系结构能够提高处理器的性能,但多核处

49、理器中有多个处理器核访问存储器,对存储系统带宽需求增加, “存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(SynchronousDataTriggeredArchitecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。 本文所取得的研究成果主要有: 1、研究多核处理器存储层次,提出了一种基于“生产-消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级 Cache 级别进行共享。根据数据访问请求处理的“生产-消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。 2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往 C/S 模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报