多核系统中通用浮点处理器的研究与设计-张斌.docx

上传人:不*** 文档编号:244737 上传时间:2018-06-28 格式:DOCX 页数:86 大小:257.53KB
返回 下载 相关 举报
多核系统中通用浮点处理器的研究与设计-张斌.docx_第1页
第1页 / 共86页
亲,该文档总共86页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《多核系统中通用浮点处理器的研究与设计-张斌.docx》由会员分享,可在线阅读,更多相关《多核系统中通用浮点处理器的研究与设计-张斌.docx(86页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、单位代码: 10359 密级: 公开 学 号: 2014110942 分类号: TN47 Hefei University of Technology 硕士学位论文 MASTER DEGREE THESIS 论文题目: 多核系统中通用浮点处理器的研究与设计 学位类别: _ 学历硕士 _ 专业名称: _ 微电子学与固体电子学 作者姓名: _ _ 导师姓名: _ 张 多 利 研 究 员 _ 完成时间: _ 2017年 03月 _ 万方数据 合 肥 工 业 大 学 _關 _|丨丨 | Y3196174 学历硕士学位论文 多核系统中通用浮点处理器的研宄与设计 作者姓名: _ JIM _ 指导教师: 张

2、 多 利 研 究 员 专业名称: 微电子学与固体电子学 研宄方向: _ SoC设计 2017年 03月 万方数据 A Dissertation Submitted for the Degree of Master The research and design of general-purpose float-point processor in multi-core system By Zhang Bin Hefei University of Technology Hefei, Anhui, P.R.China March, 2017 万方数据 合肥工业大学 本论文经答辩委员会全体委员审查

3、,确认符合合肥工业大 学硕士学位论文质量要求。 答辩委员会签名: ( 工作单位、职称 ) 主 席 : 尤 晖 中 科 院 合 肥 物 质 研 究 所 研 究 员 委 员 :梁 华 国 . 合 肥 工 业 大 学 教授 尹 勇 生 合 肥 工 业 大 学 教授 杜 高 明 合 肥 工 业 大 学 副研究员 宋 宇 鲲 合 肥 工 业 大 学 副研究员 导 师 : 张 多 利 合 肥 工 业 大 学 研究员 万方数据 学位论文独创性声明 本人郑重声明:所呈交的学位论文是本人在导师指导下进行独立研究工作所 取得的成果。据我所知,除了文中特别加以标注和致谢的内容外,论文中不包含其 他人己经发表或撰写过

4、的研宄成果,也不包含为获得 合肥工业大学 或其他教育机 构的学位或证书而使用过的材料。对本文成果做出贡献的个人和集体,本人己在论 文中作了明确的说明,并表示谢意。 学位论文中表达的观点纯属作者本人观点,与合肥工业大学无关。 学位论文作者签名 : 签 名 曰 期 年 分 月 /7曰 学位论文版权使用授权书 本学位论文作者完全了解 合肥工业大学 有关保留、使用学位论文的规定, 即:除保密期内的涉密学位论文外,学校有权保存并向国家有关部门或机构送交论 文的复印件和电子光盘,允许论文被查阅或借阅。本人授权 合肥工业大学 可以 将本学位论文的全部或部分内容编入有关数据库,允许采用影印、缩印或扫描等复 制

5、手段保存、汇编学位论文。 (保密的学位论文在解密后适用本授权书 ) 学位论文作者签名 : 签名日期 : py年鈐月日 论文作者毕业去向 工作单位: 联系电话: 通讯地址 : 指导教师签名 : 签 名 日 期 : 年 + 月 7 日 E-mail: 邮政编码 : 万方数据 致谢 时光荏苒,三年的研宄生学习即将结束,在这三年里,感受颇深,收获颇丰, 在这里我诚挚的对所有帮助过我的人表示感谢。 首先,衷心感谢张多利老师在本文选题、结构确定、设计研宄以及审核修改过 程中给予的悉心指导。张老师渊博的专业知识,严谨的治学风格、认真负责的工作 态度,给予了我极大的鼓励和帮助。 感谢宋宇鲲老师在项目研宄和论文

6、撰写过程中的耐心指导和帮助。 感谢合肥工业大学微电子设计研宄所的尹勇生老师、杜高明老师、倪伟老师、 邓红辉老师、陈红梅老师、王晓蕾老师、贾靖华老师,感谢你们对我学习中的诸多 指导和帮助。 感谢胡剑老师、范阿姨、木子一老师,感谢你们对我生活上的诸多关怀。 感谢吴凌云、孙玲、李萍萍、孙越、张扬、焦瑞、戴继祥、杨俊、王浩、高冬 雪等师兄师姐们,感谢你们在项目中对我的指导与帮助。 感谢我的同学们,李浩洋、张宇、沈休垒、钱庆松、张玲佳、于敬巨、高晓航、 姚宇,感谢大家相互之间的学习交流,是你们让我的研宄生生活更加丰富多彩。 感谢我的师弟师妹们,感谢你们在论文撰写过程中对我的帮助。 感谢我的室友胡林聪、肖

7、乃稼和黄程,是你们让寝室生活充满欢笑、快乐。 感谢我的家人对我的默默支持与关心,给了我专心研究的条件与动力。 感谢文中引用过文献的所有作者们。 最后,衷心地感谢在百忙之中评阅论文和参加答辩的各位专家、教授! 作者:张斌 2017年 3月 1日 万方数据 摘要 随着集成电路工艺和计算机技术的高速发展,传统的依靠超标量和超流水线 来提高处理器性能的方法遇到了瓶颈,多核 SoC(SystemonChip, SoC)技术应运 而生,处理器的发展方向已经从追求单核心更高主频变为追求更多的处理器核。 NoC (NetworkonChip)将并行计算技术和计算机网络应用于芯片中,在带宽、可 扩展性和可靠性等

8、方面具有较大优势,已经成为一种重要的处理器互联方式。数字 通信、图像处理、科学计算等应用对数据处理的精度和实时性的要求越来越高,硬 件系统需要具备很强的浮点运算能力。 本文以课题组的多核系统架构为基础,在研宄了多核处理器技术、片上网络技 术和在线调试技术之后,设计了一款主要针对高密度计算 领域的通用浮点处理器, 并以通用浮点处理器为运算单元搭建了多核系统,加载了相关计算任务。论文的主 要工作如下: 首先,根据高密度计算领域的算法特征和功能要求,确定了通用浮点处理器的 整体架构。为了应对数据密集型和计算密集型两类算法应用,通用浮点处理器分别 支持存储、流和脉动三种运算模式,最大程度地提高了运算灵

9、活性和效率。 其次,确定了通用浮点处理器微控制器单元、寄存器组、存储单元、网络接口 和在线调试单元等模块的具体结构和工作机制,实现了通用浮点处理器的 RTL级 设计。 最后,基于片上网络和通用浮点处理器搭建了多核系统,通过加载向量计算任 务、矩阵特征分解算法、矩阵乘运算和 FFT运算验证了通用浮点处理器和多核系 统的功能正确性、算法适应性和可调试性。 关键词:多核系统;片上网络;通用浮点处理器;高密度计算; RTL级设计 II 万方数据 ABSTRACT The traditional way which relies on superscalar and super-pipeline to

10、improve the performance of processor encounters bottleneck with the rapid development of integrated circuit and computer technology, multi-core SoC (System on Chip, SoC) technology comes into being, the direction of the processor development has gradually from the pursuit of a single core with highe

11、r frequency to the pursuit of more processor cores. NoC (Network on Chip) applies parallel computing technology and computer networks into chip and has become one significant way for inter-chip interconnect, it has a greater advantage in terms of bandwidth, scalability and reliability. At the same t

12、ime, the data processing accuracy and real-time requirements are increasingly high in the field of digital communication, image processing, scientific computing and so on, hardware system need to have strong floating-point computing capabilities. Based on the multi-core system architecture of the re

13、search group, this thesis designs a general-purpose floating-point processor and builds an multi-core system for high- density computing domain after studying the multi-core processor technology, network on chip technology and online debugging technology. The main work of this thesis is as follows:

14、First of all, the overall architecture of the general-purpose floating-point processor is determined according to the algorithm features and functional requirements in the high- density computing domain. In order to deal with data-intensive and computationintensive algorithms, the general-purpose fl

15、oating-point processor are compatible with both storage and streaming computation modes in order to maximize computational efficiency and algorithm adaptability, while adding a pulsating mode to compromise flexibility and efficiency. Secondly, the structure and working mechanism of microcontroller,

16、register group, memory unit, network interface and online debugging unit are determined and the RTL design of the general-purpose floating-point processor has been realized. Finally, this thesis builds an multi-core system based on NoC and verifies the function correctness, algorithm adaptability an

17、d debug ability through loading vector computing, matrix feature decomposition, matrix multiplication and FFT experiments. Keywords: Multi-core system; Network on chip; General-purpose floating-point processor; High-density computing; RTL design 万方数据 m-M m . i u研宄背景和研宄意义 . i 1.2研宄现状 . 2 1.3本文主要研宄内容

18、. 3 1.4课题来源 . 4 1.5论文组织结构 . 4 第二章通用浮点处理器设计原型与相关理论 . 5 2.1通用浮点处理器设计原型 . 5 2.2多核处理器技术 . 9 2.3片上网路技术 . 9 2.4在线调试技术 . 10 2.5本章小结 . 11 第三章多核系统和通用浮点处理器概述 . 12 3.1多核系统 . 12 3.2片上网络 . 12 3.2.1配置层网络 . 13 3.2.2状态层网络 . 13 3.2.3数据传输层网络 . 14 3.3主控制器 . 15 3.4DDR存储节点 . 16 3,5通用浮点处理器概述 . 17 3.5.1整体架构 . 17 3.5.2工作机制

19、 . 18 3.5.3三种运算模式 . 19 3.6本章小结 . 20 第四章通用浮点处理器的设计实现 . 21 4.1微控制器 . 21 4.1.1 MCU 指令集 . 21 4.1.2指令缓存 . 22 4.1.3指令流水线 . 23 4.1.4数据冒险处理单元 . 25 4.1.5控制冒险处理单元 . 26 4.2存储单元 . 27 4.2.1流模式下存储管理单元的设计 . 28 4.2.2地址冲突化解 . 29 4.2.3地址生成器 . 31 4.3寄存器组 . 31 IV 万方数据 4.4浮点运算单元 . 32 4.4.1浮点运算指令集 . 32 4.4.2硬件结构 . 35 4.5

20、网络接口的结构和功能 . 38 4.5.1四种数据传输类型 . 38 4.5.2硬件结构 . 40 4.6跟踪调试器模块 . 41 4.6.1程序计数器三级压缩方案 . 41 4.6.2分类筛选 . 42 4.6.3差分切片 . 44 4.6.4字典编码 . 45 4.7 FPGA 实现 . 50 4.8本章小结 . 51 第五章通用浮錢理器賺证 . 52 5.1 52 5.2实验流程 . 52 5.3通用浮点处理器测试 . 53 5.3.1基本向量运算实验 . 53 5.3.1.1任务流程和软件编程 . 53 5.3.1.2实验结果与性能分析 . 55 5.3.2矩阵特征分解实验 . 56 5.3.2.1算法介绍 . 56 5.3.2.2算法实现 . 57 5.3.2.3实验结果与性能分析 . 58 5.4多核系统测试 . 60 5.4.1矩阵乘实验 . 60 5.4.1.1算法映射方案 . 60 5.4丄 2实验结果与性能分析 . 62 5.4.2 FFT 实验 . 63 5.4.2.1算法映射方案 . . . 64 5A2.2实验结果和性能分析 . 66 5.5本章小结 . 67 . 68 6.1 . 68 6.2展望 . 68 . 69 攻读硕士学位期间的学术 _及成果情况 . 72 V 万方数据

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 论证报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com