低功耗设计方法精.ppt

上传人:石*** 文档编号:47933604 上传时间:2022-10-04 格式:PPT 页数:57 大小:8.17MB
返回 下载 相关 举报
低功耗设计方法精.ppt_第1页
第1页 / 共57页
低功耗设计方法精.ppt_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《低功耗设计方法精.ppt》由会员分享,可在线阅读,更多相关《低功耗设计方法精.ppt(57页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、低功耗设计方法第1页,本讲稿共57页内容CMOS电路的功耗来源电路的功耗来源影响功耗的因素影响功耗的因素低功耗设计方法低功耗设计方法n工艺级的优化技术工艺级的优化技术n版图和晶体管级的优化技术版图和晶体管级的优化技术nRTL级和逻辑级的优化技术级和逻辑级的优化技术n系统级的优化技术系统级的优化技术采用采用HDL的低功耗设计流程的低功耗设计流程第2页,本讲稿共57页CMOS电路的功耗来源 在数字在数字CMOS电路中,功耗是电路中,功耗是由三部分构成的由三部分构成的PTotal=Pdynamic+Pshort+PleakagenPdynamic是电路翻转时产生的动是电路翻转时产生的动态功耗态功耗n

2、Pshort是是P管和管和N管同时导通时产管同时导通时产生的短路功耗生的短路功耗nPleakage是由扩散区和衬底之间是由扩散区和衬底之间的反向偏置漏电流引起的静态的反向偏置漏电流引起的静态功耗功耗第3页,本讲稿共57页CMOS电路的功耗来源静态功耗:静态功耗:nCMOS在静态时,在静态时,P、N管只有一个导通。由于没有管只有一个导通。由于没有Vdd到到GND的直流通路,所以的直流通路,所以CMOS静态功耗应当等于零。静态功耗应当等于零。n但在实际当中,由于扩散区和衬底形成的但在实际当中,由于扩散区和衬底形成的PN结上存在反向结上存在反向漏电流,产生电路的静态功耗。静态功耗为:漏电流,产生电路

3、的静态功耗。静态功耗为:n其中:其中:n为器件个数为器件个数第4页,本讲稿共57页CMOS电路的功耗来源动态功耗:动态功耗:nCMOS电路在电路在“0”和和“1”的跳变过程中,的跳变过程中,会形成一条从会形成一条从Vdd通过通过P管网络和负载电容到管网络和负载电容到地的电流地的电流Id对负载电容进行充电,产生动态对负载电容进行充电,产生动态功耗功耗Pdynamic:Pdynamic=KCLVdd2f K:单位时间内的平均上跳次数单位时间内的平均上跳次数 f:时钟频率时钟频率第5页,本讲稿共57页CMOS电路的功耗来源短路功耗:短路功耗:nCMOS电路在电路在“0”和和“1”的转换过程中,的转换

4、过程中,P、N管会同时导通,产生一个由管会同时导通,产生一个由Vdd到到VSS窄脉冲电流,由此引起功耗窄脉冲电流,由此引起功耗n在输入波形为非理想波形时,反相器处于输在输入波形为非理想波形时,反相器处于输入波形上升沿和下降沿的瞬间,负载管和驱入波形上升沿和下降沿的瞬间,负载管和驱动管会同时导通而引起功耗动管会同时导通而引起功耗第6页,本讲稿共57页CMOS电路的功耗来源通常情况下静态功耗占总功耗的通常情况下静态功耗占总功耗的1%以下,可以忽略不计,但以下,可以忽略不计,但如果整个系统长时间处于休眠状态,这部分功耗需要进如果整个系统长时间处于休眠状态,这部分功耗需要进行考虑行考虑短路功耗在整个短

5、路功耗在整个CMOS电路的功耗中只占很小的一部分,对电路的功耗中只占很小的一部分,对于转换时间非常短的电路,于转换时间非常短的电路,Pshort所占的比例可以很小,但所占的比例可以很小,但对于一些转换速度较慢的电路对于一些转换速度较慢的电路Pshort可以占到可以占到30%左右,平左右,平均大约在均大约在10%左右。左右。一般情况下,动态功耗一般情况下,动态功耗Pdynamic占整个功耗的比例大约为占整个功耗的比例大约为70%90%。有些文献将有些文献将CMOS电路的功耗简单的分为两类:静态功耗和动电路的功耗简单的分为两类:静态功耗和动态功耗。态功耗。第7页,本讲稿共57页影响功耗的因素 从动

6、态功耗的表达式可看出,在不影响电路性能,从动态功耗的表达式可看出,在不影响电路性能,即不降低工作频率的前提下,功耗主要取决于即不降低工作频率的前提下,功耗主要取决于3个因素:个因素:n工作电压工作电压n负载电容负载电容n开关活动性开关活动性因此功耗优化主要从减小因此功耗优化主要从减小K、CL和和Vdd三方面着手。三方面着手。值得注意的是功耗优化是一个整体,单单考虑某一值得注意的是功耗优化是一个整体,单单考虑某一方面是不够的。方面是不够的。Pdynamic=KCLVdd2f第8页,本讲稿共57页影响功耗的因素电源电压的选择:电源电压的选择:n降低电源电压将使功耗下降降低电源电压将使功耗下降w但是

7、对于一定的工艺水平(具有确定的阈值电压)但是对于一定的工艺水平(具有确定的阈值电压),降低电源电压将使电路性能下降,当电源电压,降低电源电压将使电路性能下降,当电源电压降低到接近降低到接近P和和N管的阈值电压之和时,延迟时管的阈值电压之和时,延迟时间急剧增大。间急剧增大。w在较大的电压下,电路速度几乎与电源电压无关在较大的电压下,电路速度几乎与电源电压无关n为提高速度,希望在保证器件可靠性的前提为提高速度,希望在保证器件可靠性的前提下采用尽可能高的电压,为降低功耗,又希下采用尽可能高的电压,为降低功耗,又希望选择尽可能低的电压。望选择尽可能低的电压。w要解决这个矛盾,可以在一个芯片内采用多种电

8、要解决这个矛盾,可以在一个芯片内采用多种电压,对影响速度的关键电路选择较高的电压,对压,对影响速度的关键电路选择较高的电压,对大部分非关键电路则选择用减低的电压。大部分非关键电路则选择用减低的电压。第9页,本讲稿共57页影响功耗的因素负载电容:负载电容:n在在CMOS电路中电容主要由两方面构成:电路中电容主要由两方面构成:w器件栅电容和节电电容,它们和器件工艺有关器件栅电容和节电电容,它们和器件工艺有关w连线电容连线电容n改进电路结构,减少所需改进电路结构,减少所需MOS管数目是减小负载电容、管数目是减小负载电容、降低功耗的重要途径。降低功耗的重要途径。w采用动态采用动态CMOS电路可简化电路

9、电路可简化电路w采用互补传输晶体管逻辑(采用互补传输晶体管逻辑(CPL),不仅可以简化电路,还可提),不仅可以简化电路,还可提高速度高速度 n随着工艺的发展,布线电容已经超过器件电容随着工艺的发展,布线电容已经超过器件电容w为了减小电容,在工艺方面可以选择小的器件,物理设计时减小连为了减小电容,在工艺方面可以选择小的器件,物理设计时减小连线长度。线长度。第10页,本讲稿共57页影响功耗的因素开关活动性开关活动性n在在CMOS电路中,功耗和开关活动性息息相关。电路中,功耗和开关活动性息息相关。w若信号活动性为若信号活动性为0,即使负载电容很大,它也不消,即使负载电容很大,它也不消耗能量耗能量w开

10、关活动性和数据频率开关活动性和数据频率f 以及开关活动率以及开关活动率k有关:有关:f 描述单位时间内信号到达节点的次数,而活动率描述单位时间内信号到达节点的次数,而活动率k则描述到达节点时信号的翻转几率则描述到达节点时信号的翻转几率 n在有些在有些CMOS电路中,伪跳变占据了相当一部电路中,伪跳变占据了相当一部分开关活动性,由于此类信号没有任何作用,分开关活动性,由于此类信号没有任何作用,因此它造成系统功耗的白白损失。因此它造成系统功耗的白白损失。w为了降低伪跳变带来的浪费,一种办法是消除伪跳为了降低伪跳变带来的浪费,一种办法是消除伪跳变的产生,另一办法是缩短其传播长度。变的产生,另一办法是

11、缩短其传播长度。第11页,本讲稿共57页低功耗设计方法 低功耗设计是一个系统的问题:低功耗设计是一个系统的问题:n必须在设计的各个层次上发展适当的技术必须在设计的各个层次上发展适当的技术n综合应用不同的设计策略综合应用不同的设计策略n达到在降低功耗的同时维持系统性能的目的达到在降低功耗的同时维持系统性能的目的n研究证明在不同设计层次上的优化工作对功研究证明在不同设计层次上的优化工作对功耗的改善程度是不同的,即设计层次越高,耗的改善程度是不同的,即设计层次越高,改善功耗的程度越大改善功耗的程度越大 第12页,本讲稿共57页低功耗设计方法第13页,本讲稿共57页低功耗设计方法一些低功耗设计一些低功

12、耗设计(Design for Power,DFP)的基本的基本策略策略:n权衡面积和性能权衡面积和性能,使用并行、流水化和分布式计算等方法使用并行、流水化和分布式计算等方法,用面积或时间换取低功耗用面积或时间换取低功耗 n关闭不用的逻辑和时钟关闭不用的逻辑和时钟 n使用专用电路代替可编程逻辑使用专用电路代替可编程逻辑 n使用规则的算法和结构,以减少控制负荷使用规则的算法和结构,以减少控制负荷 n采用新型的低功耗器件和工艺采用新型的低功耗器件和工艺 以下将自底向上以下将自底向上,对各层次的功耗设计技术进行具对各层次的功耗设计技术进行具体分析和介绍。体分析和介绍。第14页,本讲稿共57页工艺级的优

13、化技术 多层金属布线:使用上层的金属进行全局互连多层金属布线:使用上层的金属进行全局互连,可以可以减小互连电容减小互连电容,从而减小延迟和功耗。从而减小延迟和功耗。通过加工技术的提高减小芯片和封装的电容通过加工技术的提高减小芯片和封装的电容,也能改也能改善功耗性能善功耗性能:n如采用如采用SOI 技术、多芯片模块技术、多芯片模块(MCM)能改善功耗性能。这种能改善功耗性能。这种方法非常有效但很昂贵方法非常有效但很昂贵,其发展是由投资和需求决定的。其发展是由投资和需求决定的。SOI 技术能减少寄生电容和体效应技术能减少寄生电容和体效应,从而减小功耗。从而减小功耗。由于设计工程师不能决定工艺流程由

14、于设计工程师不能决定工艺流程,工艺级的优化通工艺级的优化通常不包含在常不包含在DFP 的设计方法学中。的设计方法学中。第15页,本讲稿共57页版图和晶体管级的优化技术 布局布线布局布线 n互连线的功耗逐渐成为整个电路功耗的主要部分:互连线的功耗逐渐成为整个电路功耗的主要部分:w深亚微米工艺的结果深亚微米工艺的结果w过去的布局布线技术只考虑面积和延时的因素过去的布局布线技术只考虑面积和延时的因素w加入来自设计前端的信号活动信息加入来自设计前端的信号活动信息,可实现对功耗的优化可实现对功耗的优化n将连线安排在不同的层面上达到降低功耗的目的,主将连线安排在不同的层面上达到降低功耗的目的,主要方法包括

15、要方法包括:w找出翻转活动频繁的结点找出翻转活动频繁的结点,把这些结点安排在容性较小的层面上把这些结点安排在容性较小的层面上,如第二层金属布线层或更高的布线层如第二层金属布线层或更高的布线层 w翻转活动频繁的结点连线要尽量的短翻转活动频繁的结点连线要尽量的短 w把高容性的结点和总线放在电容较小的层面上把高容性的结点和总线放在电容较小的层面上 w大尺寸器件可采用梳状和环形结构大尺寸器件可采用梳状和环形结构,减小漏结电容减小漏结电容第16页,本讲稿共57页版图和晶体管级的优化技术 时钟树(时钟树(CLOCK-TREE)的生成的生成 n时钟信号网络的电容和频率都很大时钟信号网络的电容和频率都很大,其

16、功耗其功耗占了系统的相当部分占了系统的相当部分,有些电路有些电路可达可达40%n在保证时序约束的条件下在保证时序约束的条件下,对时钟信号网络对时钟信号网络的结构、驱动方式进行选择的结构、驱动方式进行选择,并通过缓冲器并通过缓冲器的插入和尺寸优化来减小功耗的插入和尺寸优化来减小功耗n另外另外,在对同步时钟容差分析的基础上在对同步时钟容差分析的基础上,不再不再追求时钟偏移最小化追求时钟偏移最小化,而是在保证电路时序而是在保证电路时序的条件下减小功耗的条件下减小功耗第17页,本讲稿共57页版图和晶体管级的优化技术 晶体管尺寸优化晶体管尺寸优化 n晶体管尺寸优化的方法晶体管尺寸优化的方法w与门尺寸优化

17、相同与门尺寸优化相同w已获得了布局布线后的物理信息已获得了布局布线后的物理信息,晶体管尺寸优晶体管尺寸优化可以进一步的降低功耗化可以进一步的降低功耗n优化器件尺寸有一个合理选取的问题优化器件尺寸有一个合理选取的问题,因为因为总的趋势是这样的总的趋势是这样的:w器件尺寸过小,会造成速度性能恶化器件尺寸过小,会造成速度性能恶化 w器件尺寸过大器件尺寸过大,功耗加大而速度改进并不明显功耗加大而速度改进并不明显第18页,本讲稿共57页版图和晶体管级的优化技术晶体管顺序调整晶体管顺序调整n重定序:在门中重新安排晶体重定序:在门中重新安排晶体管的位置管的位置,以优化延迟或功耗以优化延迟或功耗n如图所示如图

18、所示w当当x 2=0,x 3=1,而而x 1从从0 变成变成1 时时,节点节点y 和和z 的电容分别为的电容分别为Cy、Cz,都放电都放电w当当x 1=0,x 3=1,x 2 从从0 变成变成1 时时,只有只有Cy放电放电w如果如果x 2 比比x 1 的开关活性大的开关活性大,则则应像图中一样应像图中一样,使使x 2 的的p 管更接管更接近输出近输出y第19页,本讲稿共57页版图和晶体管级的优化技术 电路结构的选择电路结构的选择 n选用节省器件数目的逻辑电路形式选用节省器件数目的逻辑电路形式:w可减少电容可减少电容w传输门逻辑的形式比较特殊传输门逻辑的形式比较特殊,可减少器件可减少器件,尤其尤

19、其是是PMOS 管的数目管的数目n一个降低功耗的路径一个降低功耗的路径:即用互补传输门逻辑即用互补传输门逻辑(CPL)替代静态替代静态CMOS 器件器件w例如同样实现一个全加器例如同样实现一个全加器,静态静态CMOS 需用需用40 个个MOS 管管,而互补传输门逻辑而互补传输门逻辑(CPL)只用只用28个个第20页,本讲稿共57页第21页,本讲稿共57页RTL级和逻辑级的优化技术 在在RTL级和逻辑门级电路设计和综合阶段,可采用级和逻辑门级电路设计和综合阶段,可采用的的功耗优化技术主要包括功耗优化技术主要包括:n预计算技术预计算技术n重定时技术重定时技术n时钟受控技术时钟受控技术n路径平衡技术

20、路径平衡技术n工艺映射技术工艺映射技术n逻辑分解技术逻辑分解技术n状态分配技术状态分配技术n多级网络优化技术多级网络优化技术n公共表达式提取技术公共表达式提取技术第22页,本讲稿共57页门控时钟技术 同步设计中同步设计中,很大一部分功耗来自时钟。很大一部分功耗来自时钟。n时钟是唯一在所有时间都充放电的信号时钟是唯一在所有时间都充放电的信号n时钟信号通常要驱动大的时钟树时钟信号通常要驱动大的时钟树n而且而且,很多情况下会引起不必要的门的翻转很多情况下会引起不必要的门的翻转门控时钟门控时钟(gated clock)技术技术:n将电路无计算任务的部分的时钟停下将电路无计算任务的部分的时钟停下,减少无

21、用功耗减少无用功耗 第23页,本讲稿共57页门控时钟技术门控时钟方法:门控时钟方法:n根据现态和输入,模块根据现态和输入,模块F 判定电路下一周期是否是空闲周期判定电路下一周期是否是空闲周期n如果是如果是,则停掉寄存器则停掉寄存器R 的时钟的时钟 避免下一个时钟周期时避免下一个时钟周期时,组合电路的无用组合电路的无用翻转。翻转。nGCLK就是门控时钟信号。锁存器就是门控时钟信号。锁存器L的作用是滤掉功能块的作用是滤掉功能块F 可能输出的毛可能输出的毛刺。如果组合电路在关键路径上刺。如果组合电路在关键路径上,则则F 的加入可能使延迟不能满足要求。的加入可能使延迟不能满足要求。第24页,本讲稿共5

22、7页预计算技术 预计算设计技术:预计算设计技术:n在逻辑级实现的挂起方法在逻辑级实现的挂起方法n加入预计算逻辑加入预计算逻辑n在一定的输入条件下在一定的输入条件下,使所有或部分输入寄使所有或部分输入寄存器的负载无效存器的负载无效,从而降低了功耗。从而降低了功耗。第25页,本讲稿共57页预计算技术一个预计算比较器的结构:一个预计算比较器的结构:n当当A 与与B 的最高位不同时的最高位不同时,起预计算作用的异或门会使寄存器起预计算作用的异或门会使寄存器2 和寄存器和寄存器3 无效无效,即让这部分电路挂起即让这部分电路挂起;而输出比较结果而输出比较结果F 由一位比较器由一位比较器(MSB)输出。输出

23、。n假设首位输入的取值为假设首位输入的取值为“0”或或“1”的几率是相等的的几率是相等的,那么电路被挂起的几那么电路被挂起的几率就是率就是0.5,对于位数较多的比较器对于位数较多的比较器,功耗降低显著。功耗降低显著。第26页,本讲稿共57页逻辑优化设计逻辑优化设计:也叫工艺映射逻辑优化设计:也叫工艺映射n主要目的是减少信号的翻转活动主要目的是减少信号的翻转活动n通过将逻辑电路的逻辑功能尽可能的分解通过将逻辑电路的逻辑功能尽可能的分解,使翻转活动最小使翻转活动最小n将翻转活动高的结点隐藏到复杂的门里将翻转活动高的结点隐藏到复杂的门里,以此来降低这以此来降低这些结点的等效电容些结点的等效电容n在不

24、影响电路性能的条件下,逻辑优化设计可以将功耗减少在不影响电路性能的条件下,逻辑优化设计可以将功耗减少20%(a)是将逻辑功能用最简单的门表示;是将逻辑功能用最简单的门表示;(b)是把翻转活动高的结点进行隐藏。是把翻转活动高的结点进行隐藏。第27页,本讲稿共57页时序调整(retiming)时序调整时序调整:n在流水化的电路中在流水化的电路中,插入新的寄存器,或重新安排寄存器插入新的寄存器,或重新安排寄存器的位置的位置n减少门的翻转频率减少门的翻转频率n或减少通过流水线的最长段延迟或减少通过流水线的最长段延迟第28页,本讲稿共57页组合逻辑综合和优化 逻辑提取:寻找在逻辑网表中多次重复出现的表逻

25、辑提取:寻找在逻辑网表中多次重复出现的表达式。用这个表达式的输出节点代替在网表中出达式。用这个表达式的输出节点代替在网表中出现的相同的式子现的相同的式子,达到节约面积的目的达到节约面积的目的 提取公因子:在函数的积之和形式中导出公因子提取公因子:在函数的积之和形式中导出公因子 表达式替换:利用低有效电容的电路块代替网表中的表达式替换:利用低有效电容的电路块代替网表中的电路电路节点消除:选择性地消除网表中的某些节点节点消除:选择性地消除网表中的某些节点 第29页,本讲稿共57页路径平衡技术路径平衡:路径平衡:n为使某一器件的几个输入信号同时到达为使某一器件的几个输入信号同时到达,而而采用的路径等

26、延迟技术采用的路径等延迟技术n能大大减少在该器件输出端产生多余翻转的能大大减少在该器件输出端产生多余翻转的可能可能n路径平衡技术可以在工艺映射前采用路径平衡技术可以在工艺映射前采用,对逻对逻辑进行分解以达到平衡辑进行分解以达到平衡n也可以在工艺映射后采用也可以在工艺映射后采用,对管腿重新排序对管腿重新排序分配和插入延时元件以达到平衡。分配和插入延时元件以达到平衡。第30页,本讲稿共57页路径平衡技术 a,b 同时到达的两信号同时到达的两信号;期望信号期望信号X 为一恒为一恒0 的输出的输出图图(a)所示电路的不平衡所示电路的不平衡,可能造成信号的毛刺可能造成信号的毛刺图图(b)由于路径平衡而减

27、少这一毛刺由于路径平衡而减少这一毛刺第31页,本讲稿共57页引脚分配一般情况下一般情况下,对于库单元功能相同的引脚对于库单元功能相同的引脚,在综合时是等价的在综合时是等价的 实际上实际上,不同引脚的电容、信号延时等参数是不同的不同引脚的电容、信号延时等参数是不同的引脚分配的基本思想:就是将活动因子大的信号结点分配到相对功耗小的引脚分配的基本思想:就是将活动因子大的信号结点分配到相对功耗小的引脚上引脚上第32页,本讲稿共57页系统级的优化技术 软硬件划分软硬件划分n软硬件划分是从系统功能的抽象描述软硬件划分是从系统功能的抽象描述(如如语言语言)着手着手,把系统功能分解为硬件和软件来把系统功能分解

28、为硬件和软件来实现实现n对于一个系统功能的任务对于一个系统功能的任务,可通过在微处理可通过在微处理器上运行软件来实现和通过专用电路实现器上运行软件来实现和通过专用电路实现n比较两者的功耗得出一个低功耗的实现方案比较两者的功耗得出一个低功耗的实现方案n软硬件划分的技术处于设计的起始阶段软硬件划分的技术处于设计的起始阶段,给给降低功耗带来更大的可能降低功耗带来更大的可能第33页,本讲稿共57页系统级的优化技术 指令级优化指令级优化包括几个方面包括几个方面:n指令集提取指令集提取:对于确定的处理器对于确定的处理器,其每条指令的功耗是一定其每条指令的功耗是一定的的,选择一个指令集实现系统功能并功耗最小

29、选择一个指令集实现系统功能并功耗最小n选择合理的指令长度:如选择合理的指令长度:如16位位.32位或可变长度位或可变长度,提高提高程序的代码密度程序的代码密度,以减少对存储器访问的功耗以减少对存储器访问的功耗n指令编码优化:通过对应用程序指令的相关性的统计指令编码优化:通过对应用程序指令的相关性的统计,对对指令进行编码优化指令进行编码优化,使读取指令时总线上的信号反转最少使读取指令时总线上的信号反转最少n指令压缩指令压缩:存储器存储压缩后的指令存储器存储压缩后的指令,指令将在进入处理指令将在进入处理器前被解压器前被解压第34页,本讲稿共57页系统级的优化技术 电源管理电源管理n可变电压技术:可

30、变电压技术:根据系统的不同工作状态对系统性能的不同要求根据系统的不同工作状态对系统性能的不同要求,动态地改变电压以最大限度地降低功耗动态地改变电压以最大限度地降低功耗w电压转换电路的功耗和电压转换时间对性能的影响是这项技术选择的制电压转换电路的功耗和电压转换时间对性能的影响是这项技术选择的制约因素约因素n多电压技术:可变电压技术在时间上改变电压多电压技术:可变电压技术在时间上改变电压,而多电压技术而多电压技术在空间上使用不同的电压在空间上使用不同的电压.w根据系统不同部分的性能要求不同根据系统不同部分的性能要求不同,使其工作于不同的电压使其工作于不同的电压,从而降低系统功从而降低系统功耗耗n动

31、态功耗管理:动态功耗管理是一种使系统或系统单元在不工作动态功耗管理:动态功耗管理是一种使系统或系统单元在不工作时进入低功耗的休眠状态的控制技术时进入低功耗的休眠状态的控制技术w由于系统在正常工作状态和休眠状态之间的转换需要时间由于系统在正常工作状态和休眠状态之间的转换需要时间,将影响系统性将影响系统性能能w所以所以,该技术的核心就是如何根据系统的状态信息决定系统何时进入该技术的核心就是如何根据系统的状态信息决定系统何时进入低功耗的休眠状态低功耗的休眠状态第35页,本讲稿共57页系统级的优化技术Cache低功耗技术低功耗技术n片上片上cache产生的功耗占据整个芯片功耗的产生的功耗占据整个芯片功

32、耗的很大比例很大比例wDEC Alpha 21264中的中的cache的功耗约占芯片功耗的功耗约占芯片功耗的的25 n能量大部分消耗:能量大部分消耗:w在标签和数据阵列的预充(在标签和数据阵列的预充(precharging)w灵敏放大(灵敏放大(sensing)w放电放电第36页,本讲稿共57页系统级的优化技术M.Viredaz and D.Wallach,“Power Evaluation of a Handheld Computer:A Case Study”,WRL Research Report 2001/1(HP)peripherals(analog)interfacesDRAMpr

33、ocessor+cacheMemory第37页,本讲稿共57页系统级的优化技术降低降低cache动态功耗:动态功耗:n降低电路的等效电容小容量缓冲器降低电路的等效电容小容量缓冲器w在在L1 cache和和CPU之间增加一个容量较小的之间增加一个容量较小的cache,如,如L0 cache、Filter cache方案方案 n降低组相联降低组相联cache功耗避免多余标签比较功耗避免多余标签比较w分阶分阶cache:两个阶段访问:标签访问和比较为第一阶段。在第两个阶段访问:标签访问和比较为第一阶段。在第二阶段只有命中的那一路数据被访问。结果是降低数据路访问的二阶段只有命中的那一路数据被访问。结果

34、是降低数据路访问的功耗,但是却增加了功耗,但是却增加了cache访问延迟。访问延迟。w路预测路预测cachecache:在标签访问前预测哪一路可能有被访问数据。如果预测正:在标签访问前预测哪一路可能有被访问数据。如果预测正确,标签阵列访问就不需要了,而访问延迟相当于同样大小的直接映像确,标签阵列访问就不需要了,而访问延迟相当于同样大小的直接映像cachecache的访问延迟。但是如果预测失败,就必须进行标签比较,结果是增的访问延迟。但是如果预测失败,就必须进行标签比较,结果是增加了额外的访问时间,相应功耗多于传统组相联加了额外的访问时间,相应功耗多于传统组相联cachecache。n代码压缩结

35、构:代码压缩结构:wI-cache中存入经过压缩的指令:提高了中存入经过压缩的指令:提高了cache命中率,减少了主存访命中率,减少了主存访问次数,减少了取指的功耗问次数,减少了取指的功耗 第38页,本讲稿共57页系统级的优化技术降低降低cache静态功耗:静态功耗:n门控电源技术(门控电源技术(Gated-Vdd):):w当当SRAM单元没有被访问,如果将单元没有被访问,如果将L点电压升高,那么点电压升高,那么VH-VL减小,减小,从而减少亚阈值漏电流。从而减少亚阈值漏电流。w可以在地与可以在地与L之间插入一个门控接地之间插入一个门控接地NMOS管。当单元空闲时,管。当单元空闲时,NMOS关

36、关断同时被漏电充电,使电压升高直到一个饱和值。断同时被漏电充电,使电压升高直到一个饱和值。6管SRAM单元第39页,本讲稿共57页系统级的优化技术降低降低cache静态功耗:静态功耗:n动态重构尺寸动态重构尺寸cache:可以动态分配:可以动态分配cache大大小以适应应用程序所需小以适应应用程序所需cache容量。容量。w当尺寸减小时,采用门控电源技术关掉当尺寸减小时,采用门控电源技术关掉cache中中不需要的部分的电源供应,从而减少漏电功耗。不需要的部分的电源供应,从而减少漏电功耗。ncache衰退(衰退(cache decay):):w当当cache行进入垂死区(行进入垂死区(dead

37、period成功访问成功访问到驱逐出到驱逐出cache的时段)时,关闭单个的时段)时,关闭单个cache行。行。第40页,本讲稿共57页系统级的优化技术 总线低功耗设计总线低功耗设计n电容大、数据传输密度高电容大、数据传输密度高,产生大量功耗产生大量功耗n总线的低功耗设计包括总线的低功耗设计包括:w减小总线上信号的电压变化幅度:通常小于减小总线上信号的电压变化幅度:通常小于1n对降低具有特大电容总线的功耗非常有效对降低具有特大电容总线的功耗非常有效n额外代价是总线和功能模块之间的信号电平的变换电路额外代价是总线和功能模块之间的信号电平的变换电路w对总线进行分段控制对总线进行分段控制:n根据总线

38、和功能模块连接的物理结构根据总线和功能模块连接的物理结构,在信号传输时在信号传输时,隔隔断总线的无关部分断总线的无关部分,从而减小总线的实际电容从而减小总线的实际电容,以降低功以降低功耗耗w总线数据的编码总线数据的编码:n使数据在总线上传输时引起的电平反转减少使数据在总线上传输时引起的电平反转减少(即减小了活即减小了活动因子动因子)第41页,本讲稿共57页系统级的优化技术 合适的总线编码技术合适的总线编码技术,可以使翻转活动最可以使翻转活动最小化小化:nGray-code:连续的两个二进制数之间只有连续的两个二进制数之间只有一位不同。一位不同。w在总线传输连续变化的数据时在总线传输连续变化的数

39、据时(比如地址总线的比如地址总线的变化变化),只有一位发生变化只有一位发生变化 总线的翻转活动大总线的翻转活动大大减少大减少,从而降低功耗。从而降低功耗。第42页,本讲稿共57页通过将这两种编码方法应用到指令地址总线进行比较通过将这两种编码方法应用到指令地址总线进行比较,结果是结果是Gray-code 编码可以将位变化降低编码可以将位变化降低,最大达最大达58%,而平均降低也达到而平均降低也达到37%。第43页,本讲稿共57页系统级的优化技术其它总线编码技术:其它总线编码技术:T0 编码、自适应编码、自适应编码、编码、BI 编码等。编码等。n如图为如图为T0-C编码编码w地址连续则总线编地址连

40、续则总线编码保持码保持w如果与初始值相同,如果与初始值相同,采用递增值采用递增值w如果为非连续值,如果为非连续值,则采用该值则采用该值实际地址实际地址总线编码总线编码模式模式25252625保持保持2725保持保持3939目标目标4039保持保持4139保持保持3942无歧义无歧义4042保持保持4142保持保持4242保持保持4342保持保持第44页,本讲稿共57页系统级的优化技术各种总线编码实现的机理不同各种总线编码实现的机理不同n有的需要加标志位有的需要加标志位:T0编码编码n有的需要对过去一段时间的数据进行特征统有的需要对过去一段时间的数据进行特征统计:计:Codebook编码编码n目

41、的是尽量减少总线上的位变化目的是尽量减少总线上的位变化第45页,本讲稿共57页系统级的优化技术 算法的优化可以极大减少操作步骤,从而使功耗降低。算法的优化可以极大减少操作步骤,从而使功耗降低。n例:一个矢量量化例:一个矢量量化(VQ)算法(压缩图像数据),算法(压缩图像数据),VQ编编码有全搜索、树形搜索和差分码有全搜索、树形搜索和差分-树形搜索三种算法,下树形搜索三种算法,下表比较了三种算法的运算复杂性。表比较了三种算法的运算复杂性。算法的优化可以使运算步骤有几个数量级的减少,算法的优化可以使运算步骤有几个数量级的减少,因而对降低功耗有重要作用。因而对降低功耗有重要作用。第46页,本讲稿共5

42、7页系统级的优化技术 异步逻辑异步逻辑n异步逻辑是完全不同于同步设计的一种设计方法。异步逻辑异步逻辑是完全不同于同步设计的一种设计方法。异步逻辑不采用全局时钟而是用握手信号电路协调模块间的协作不采用全局时钟而是用握手信号电路协调模块间的协作,不不存在时钟偏斜问题。存在时钟偏斜问题。n单一时钟设计使得整个芯片的不同部分都必须应用相同频单一时钟设计使得整个芯片的不同部分都必须应用相同频率的时钟率的时钟,而系统的有些部分没有必要用这样高的频率而系统的有些部分没有必要用这样高的频率,这也这也导致功耗增加。导致功耗增加。n异步电路本质上是数据驱动的异步电路本质上是数据驱动的,能最大限度地利用能量。接能最

43、大限度地利用能量。接受较少数据的模块自然能在较低的频率下工作。受较少数据的模块自然能在较低的频率下工作。第47页,本讲稿共57页系统级的优化技术 并行处理并行处理n并行处理是最重要的低功耗措施,主要思想是通过并行设计并行处理是最重要的低功耗措施,主要思想是通过并行设计和流水线设计两种并行处理方式提高电路性能,降低电路的和流水线设计两种并行处理方式提高电路性能,降低电路的功耗。功耗。并行设计(并行设计(Parallelism)n并行设计将数据流中一个功能模块并行设计将数据流中一个功能模块“复制复制”为为n个个(n=2)模块。这些模块并行计算后通过多路选择器输出。)模块。这些模块并行计算后通过多路

44、选择器输出。n由于有由于有n个相同的模块同时工作,可以把驱动每个模块个相同的模块同时工作,可以把驱动每个模块的时钟频率降低为原频率的的时钟频率降低为原频率的1/n分频,而电路总的输出分频,而电路总的输出仍然能保持原来的速度。仍然能保持原来的速度。第48页,本讲稿共57页并行设计并行结构降低功耗的主要原因:并行结构降低功耗的主要原因:n在获得与参考结构相同的计算速度的前提下在获得与参考结构相同的计算速度的前提下,其工作频率可以降低为其工作频率可以降低为原来的原来的1/2,同时电源电压也可降低。同时电源电压也可降低。第49页,本讲稿共57页并行设计参考结构:工作频率为参考结构:工作频率为50 MH

45、z,电源电压为电源电压为3.3 V,最坏情况最坏情况下的延迟为下的延迟为20ns。在这种情况下。在这种情况下,无法通过降低电源电压来无法通过降低电源电压来降低功耗降低功耗,因此因此并行结构并行结构:使频率降为使频率降为25 MHz,这样最坏情况下的延迟可以这样最坏情况下的延迟可以达到达到40 ns,而电源电压通过验证可以降低为而电源电压通过验证可以降低为1.8 V,即为原来即为原来的的1/1.83。当然由于电路的加倍和外部布线的增加。当然由于电路的加倍和外部布线的增加,其等效的其等效的电容也要增加为原来的电容也要增加为原来的2.2 倍。可以得出并行结构功耗与参考结倍。可以得出并行结构功耗与参考

46、结构功耗近似的对应关系:构功耗近似的对应关系:第50页,本讲稿共57页并行设计并行结构可以采用多个单元并行并行结构可以采用多个单元并行,但随着但随着单元数的增加会出现一些问题。单元数的增加会出现一些问题。n首先是芯片面积增大首先是芯片面积增大,成本增加成本增加n其次是布线长度增加其次是布线长度增加,从而使线电容增加从而使线电容增加n此外电压的降低受阈值电压的限制此外电压的降低受阈值电压的限制,当电压当电压接近阈值电压时接近阈值电压时,延迟退化延迟退化n由于以上问题的影响由于以上问题的影响,并行单元过多反而可并行单元过多反而可能使功耗增加能使功耗增加,在设计时要进行充分的考虑在设计时要进行充分的

47、考虑,使并行的效果达到最优。使并行的效果达到最优。第51页,本讲稿共57页流水线设计(Pipeline)另一个并行处理是采用流水线设计:另一个并行处理是采用流水线设计:n它的基本思想是控制穿过数据通路的指令流,以获得最大的吞吐量(如它的基本思想是控制穿过数据通路的指令流,以获得最大的吞吐量(如每秒能处理的指令数),从而提高电路性能。每秒能处理的指令数),从而提高电路性能。n流水线把指令划分成多个步骤,充分利用数据流通路子模块的每个时钟周期,流水线把指令划分成多个步骤,充分利用数据流通路子模块的每个时钟周期,并行处理多条指令,以最大限度地发挥电路的潜能。并行处理多条指令,以最大限度地发挥电路的潜

48、能。第52页,本讲稿共57页流水线设计电路的工作频率没有改变电路的工作频率没有改变,但每一级的电路减少但每一级的电路减少,这样在满足最坏这样在满足最坏20 ns 延迟延迟(50 MHz)的条件下的条件下,电电源电压可以由源电压可以由3.3 V 降到降到1.8 V,减少为原来的减少为原来的1/1.83。由于加入了流水线寄存器。由于加入了流水线寄存器,等效电容变为原来等效电容变为原来的的1.2 倍。其功耗的估算公式如下倍。其功耗的估算公式如下:可见采用流水线结构也可以显著地降低功耗。可见采用流水线结构也可以显著地降低功耗。第53页,本讲稿共57页并行处理如果将流水线设计和并行设计相结合,如果将流水

49、线设计和并行设计相结合,可以使功耗进一步减小。可以使功耗进一步减小。第54页,本讲稿共57页功耗优化和分析工具 用于功耗设计的用于功耗设计的EDA软件主要用于三个方面:建立软件主要用于三个方面:建立功耗模型、功耗优化、功耗分析。功耗模型、功耗优化、功耗分析。n功耗优化工具可以对电路进行适当的修改,在保证完成功耗优化工具可以对电路进行适当的修改,在保证完成原来功能的前提下,降低电路的功耗;原来功能的前提下,降低电路的功耗;n功耗分析是根据从电路模型中提取的参数来估算电路的功耗功耗分析是根据从电路模型中提取的参数来估算电路的功耗目前较为流行的功耗优化和分析工具是目前较为流行的功耗优化和分析工具是S

50、ynopsys公司的,如公司的,如RTL和门级功耗优化工具和门级功耗优化工具Power Compiler。RTL功耗分析工具为功耗分析工具为Design Power,门级功耗分析工门级功耗分析工具为具为Power Gate,晶体管和版图级功耗分析工具为,晶体管和版图级功耗分析工具为Power Mill。第55页,本讲稿共57页采用HDL的低功耗设计流程 第56页,本讲稿共57页思考题CMOS电路的功耗有哪几部分组成?给电路的功耗有哪几部分组成?给出出CMOS电路总功耗的表达式。说明影电路总功耗的表达式。说明影响功耗的因素。响功耗的因素。说明在集成电路设计时改善电路功耗的说明在集成电路设计时改善

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com