ImageVerifierCode 换一换
格式:PPT , 页数:17 ,大小:453KB ,
资源ID:1282954      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-1282954.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(汇流排编码架构.ppt)为本站会员(天天快乐)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

汇流排编码架构.ppt

1、資訊學院研究能量與研發成果,Architecture and Systems 研究群報 告 人:單智君 陳昌居 鍾崇斌中華民國95年11月30日,資訊學院研究群,資訊科學與工程研究所研究群 architecture and systems鍾崇斌、單智君、陳昌居,Architecture and SystemsResearch Directions,Embedded processor and SoCJava processor, JIT compilation &VMDSP designs and compilationLow-power systemsGraphic processorSup

2、erscalar ARM processorReconfigurable computingAsynchronous circuits,Architecture and SystemsR&D Results,ARM9-compatible processor with video/audio capabilitiesJava stack operations foldingMemory Constrained Java Just-in-time CompilerAsynchronous 8051 for low-power SOC applicationsDSP instruction set

3、 extensions Low-power Branch-Target-Buffer Low-power bus encodingsLow-power cache memoryGraphic processor design techniquesSuperscalar ARM Reconfigurable computing,ARM9-compatible Processor with Audio/Video Capabilities,ARMAVP (ARM Audio Video Processor) 為32位元微處理器,採用負載平衡良好的五階管線設計,分別為 Fetch Unit、Deco

4、der Unit、Execution Unit、Memory access Unit 以及 Write Back Unit。對各階的設計進行效能的最佳化,以提高時脈頻率,並提供有效率的機制,降低了因為記憶體速度太慢對微處理機效能上的影響特性支援Conditional ExecutionABP 緩衝器設計改良指令抓取所需時間精確中斷控制結構非同步的記憶體存取 動態暫存器組的映射分支指令的快速處理多功能有效率的執行路徑分散式指令控制編碼功能驗證與評估所有功能已在Altera EP20K600EBC652-1上完成驗證。根據Decode Stage之模擬結果,在FPGA上可工作於45MHz,預期實做

5、為晶片時可達210MHz,Java Stack Operations Folding,JVM: Stack Based MachineJVM Performance Bottleneck: Stack Operation Dependency,Constant Register,(CR),Local Variable,(LV),Branch Unit,Complex Instr.,Local Variable,(LV),Execution Unit,Producer,(P),Operator,(O),Consumer,(C),Operand Stack,1,2,4,5,3,Constant R

6、egister,(CR),Local Variable,(LV),Branch Unit,Complex Instr.,Local Variable,(LV),Producer,(P),Operator,(O),Consumer,(C),Operand Stack,1=1 fold 2,5=4 fold 5,3,Before Folding,After Folding,Execution Unit,Memory Constrained Java Just-in-time Compiler,Mixed mode executionComplex bytecode is executed by t

7、he interpreterFast compilationTwo pass compilationSimple but effective optimizationsAbout 300 cycles per bytecodeSmall memory usageAbout 23KB for static footprint4KB code buffer is sufficient for common usage,Asynchronous 8051 for Low-Power SOC Applications,SA8051 (Balsa Asynchronous8051) 為一個8位元低耗電量

8、微控制器, 相容於Intel MCS-51,採用非同步 電路方式設計,動態耗電量約為 同步版本的三分之一。特性 - 無中央時脈 - 4-phase交握的設計 - soft-core 處理器 - 低耗電量 - 透過交握介面與同步IP整合 - 針對資料與控制路徑做最佳化功能驗證與評估所有功能已在Xilinx FPGA Spartan IIE 300 ft256上完成驗證。根據XPower之模擬結果,動態耗電量約為同步版本的三分之一。,DSP Instruction Set Extensions,Current directionsApplication-specific instruction s

9、et extensions (ISE) generationWhy ISE ?Improvement performance.Keep flexibility and efficiency of original processorWhat is ISE ?Group frequently executed instruction patterns to be an extended instructionExecuted in extra hardware, “Application Specific Functional Unit (ASFU)”,DSP Instruction Set E

10、xtensions (cont.),Current research topics Multiple-issue architectureExploring ISE in a multiple-issue architecture, such as superscalar or Very Long Instruction Word (VLIW)Hardware reusebilityReuse same or similar hardware resources in different ASFUs while keep same performance Overcome register f

11、ile read/write port constraintTry to schedule the input and output of ASFU at different time slots,BTB lookup operations of non-branch instructions are useless and only waste power,Branch Distance Generation and Collection將兩相鄰分支指令間的非分支指令個數蒐集紀錄。,Next Upcoming Branch Instruction Location取得下一道分支指令的位置並且

12、在其來臨前停止所有BTB Lookup動作。,Low-power Branch Target Buffer,Branch Distance Table,Low-power Bus Encodings,在此我們針對不同的匯流排架構的特性,提出了不同的低電耗匯流排編碼系統。我們的編碼系統利用了各種編碼方法,將藉由匯流排傳輸的資料,以最具有電耗效率的方式來傳送,達到省電的效果。低電耗匯流排編碼系統,Low-power Cache Memory,快取記憶體佔有整體處理器超過50%之功耗低功耗快取記憶體設計Loop Buffer: 將loop code置入低耗電存取之loop buffer中以節省指令擷

13、取之功耗Power Manager:將不常使用之快取記憶體區塊置入低耗電模式以節省快取記憶體之靜態功號。,Graphic Processor,1,2,3,4,5,研究目的進行新一代繪圖處理器架構研究,於像素著色器 (Pixel Shader)、材質 (Texture) 及深度處理 (Depth Processing) 等三大方向提出硬體架構及軟體驗證環境。目前成果分項說明如下,A dynamically reconfigurable graphics hardware for resource reallocatable rendering pipeline A Reconfigurable

14、Texture Mapping Architecture Implementation of texture Compression by GPU Driver Register Renaming for Pixel Shaders data/value managementInstruction scheduling mechanism for 3D GPU pixel shaderAn Efficient Texture Memory System DesignsAlpha Blending without Z Sort,6,Superscalar ARM,Goal: a supersca

15、lar embedded processor featuring800MHz clock rate 0.13um 1.8DMIPS / MHz superscalar performance under tough pipeline latency 800K gate count cost-effective designDirections and achievementsMicro-architectureA 12-stage dual-issue superscalar processor with good instruction fetch rate, issue rate, and

16、 efficient forwarding SimulatorA cycle-accurate simulator modeling more details than the well-known simplescalar simulatorCompilerWorking on GCC machine description to optimize performance,Reconfigurable Computing,Motivations:Improving the Design Methodology of Embedded System HardwareProviding a Be

17、tter Performance with Low Development Cost Shorting the Time-to-Market of SoC ProductsResearch Issues:Hardware/Software PartitionSynthesize TechnologyReconfigurable Processing Element Design,Reconfigurable Architecture,( 1 / 2 ),Reconfigurable Computing (cont.),( 2 / 2 ),Detailed Design of Reconfigurable Architecture,A Design of Reconfigurable Architecture,Scaleable Design of PE,Published Research Results: Run-time Reconfigurable Scheduling of 3D-Rendering on a Reconfigurable System (CCCT05) Design and Implementation of a Reconfigurable Hardware for Secure Embedded Systems (ASIACCS06),

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报