当前位置: 首页 > news >正文

东至网站定制网站和管理系统哪个更难做

东至网站定制,网站和管理系统哪个更难做,简单ppt模板下载免费完整版,wordpress如何建站呢本文仅供学习#xff0c;不作任何商业用途#xff0c;严禁转载。部分资料取自----计算机系统结构教程(第二版)张晨曦等。部分资料来自----国科大计算机体系结构课程PPT–张科、刘珂、高婉玲 计算机体系结构----静态超标量流水线及循环展开#xff08;一#xff09; 摘要静… 本文仅供学习不作任何商业用途严禁转载。部分资料取自----计算机系统结构教程(第二版)张晨曦等。部分资料来自----国科大计算机体系结构课程PPT–张科、刘珂、高婉玲 计算机体系结构----静态超标量流水线及循环展开一 摘要静态编译器流水线调度循环展开静态超标量流水线 摘要 本文先简要介绍静态编译器流水线调度消除数据冒险再介绍循环展开Loop Unrolling技术消除控制冒险最后再结合静态超标量流水线技术增加IPC和循环展开技术对示例代码进行优化分析。 静态编译器流水线调度 假定有如下代码 for(i 1000; i 0 ; i--)x[i] x[i] s;上述代码转换成MIPS的汇编代码如下 注意汇编代码段1先忽略各条指令之间的stall即假定各条指令之间无stall 汇编代码段1 L.D F0, 0(R1) ; F0 array elementADD.D F4, F0, F2 ; add scalarS.D F4, 0(R1) ; store resultDADDUI R1, R1,# -8 ; decrement address pointerBNE R1, R2, Loop ; branch if R1 ! R2NOP现在我们做如下规定 LD - any : 1 stall FPMUL - any: 5 stalls FPMULST : 4 stalls IntALU -BR : 1 stall FPALU - ST :2stalls FPALU- any: 3stalls BR指的是分支指令。 每个BR指令后续都存在一个Stall。 那么汇编代码段1在上述假定下实际执行情况如下 汇编代码段2 L.D F0, 0(R1) ; F0 array elementstallADD.D F4, F0, F2 ; add scalarstallstallS.D F4, 0(R1) ; store resultDADDUI R1, R1,# -8 ; decrement address pointerstallBNE R1, R2, Loop ; branch if R1 ! R2stall汇编代码段2一共花费10 cycles。 在经过编译器的调度后汇编代码段2变成如下代码段注意此时各条指令间不是不存在stall而是被“合理”消除了 汇编代码段3 L.D F0, 0(R1) DADDUI R1, R1,# -8ADD.D F4, F0, F2 stallBNE R1, R2, LoopS.D F4, 8(R1) 汇编代码段3一共花费6 cycles。 实际上汇编代码段3真正在工作的时间只有ADD.D L.D S.D这三条指令DADDUI BNE指令都是循环判断指令知道了这个信息后那我们还有再优化的空间吗我们希望把几乎每个循环都控制在三个有效指令在工作不想在每个循环中都加上循环判断指令。 循环展开 上面的汇编代码段3还可以依靠循环展开来二次优化。优化后的结果如下。 汇编代码段4注意汇编代码段4先忽略各条指令之间的stall即假定各条指令之间无stall L.D F0, 0(R1) ADD.D F4, F0, F2 S.D F4, 0(R1)L.D F6, -8(R1)ADD.D F8, F6, F2S.D F8, -8(R1)L.D F10,-16(R1)ADD.D F12, F10, F2S.D F12, -16(R1)L.D F14, -24(R1)ADD.D F16, F14, F2S.D F16, -24(R1)DADDUI R1, R1, #-32BNE R1,R2, Loop如果我们考虑上汇编代码段4的各条指令间的stall再合理的调度指令把stall给消除可以得到如下代码段。注意此时各条指令间不是不存在stall而是被“合理”消除了 汇编代码段5 L.D F0, 0(R1) L.D F6, -8(R1)L.D F10,-16(R1)L.D F14, -24(R1)ADD.D F4, F0, F2 ADD.D F8, F6, F2 ADD.D F12, F10, F2ADD.D F16, F14, F2S.D F4, 0(R1)S.D F8, -8(R1)DADDUI R1, R1, # -32S.D F12, 16(R1)BNE R1,R2, LoopS.D F16, 0(R1)汇编代码段5一共花费14 cycles但是却做了汇编代码段2 40个cycles的事 汇编代码段5每个原循环的cycle数为14/4 3.5 14/4 中的14表示4个循环的总cycle数4表示4个循环 我们把这种一个循环展开四次在英文术语上称为Degree4即循环展开N次称为DegreeN。 当然这还不是我们的极限我们还可以使用静态超标量流水线继续加速 静态超标量流水线 静态超标量可以简单理解成处理器一次性发射两条指令一条是整数指令一条是浮点指令以此来实现IPC 1的效果。 将汇编代码段5改写成静态超标量流水线的形式同时汇编代码段5的四次循环展开Degree4变成Degree5代码段如下。 汇编代码段6 Integer pipeline FP pipelineL.D F0,0(R1) NOPL.D F6,-8(R1) NOPL.D F10,-16(R1) ADD.D F4,F0,F2L.D F14,-24(R1) ADD.D F8,F6,F2L.D F18,-32(R1) ADD.D F12,F10,F2S.D F4,0(R1) ADD.D F16,F14,F2S.D F8,-8(R1) ADD.D F20,F18,F2S.D F12,-16(R1) NOPDADDUI R1,R1,# -40 NOPS.D F16,16(R1) NOPBNE R1,R2,Loop NOPS.D F20,8(R1) NOP记住我们做的如下规定注意汇编代码段6是建立在这个规定下的。 LD - any : 1 stall FPMUL - any: 5 stalls FPMULST : 4 stalls IntALU -BR : 1 stall FPALU-ST : 2stalls FPALU- any: 3stalls BR指的是分支指令。 每个BR指令后续都存在一个Stall。 NOP No option 即无操作。
http://www.huolong8.cn/news/245119/

相关文章:

  • 营销推广型网站WordPress自定义信息登记
  • 单位建设网站需要的材料做app还是做微网站好
  • 京东优惠券网站怎么做郑州男科医院排行哪家最好
  • 珠宝静态网站模板胶州网站建设公司
  • 做网站编辑有人带吗h5游戏排行榜前十名
  • 怎样运营网站wordpress实现会员中心
  • 新闻类网站建设用户权限网站
  • 网站建设商务通什么意思温州网站
  • 临沂网站关键字优化站内推广和站外推广的区别
  • 温州公司建设网站制作企业网站推广的方法有哪几种
  • access建网站淘宝网首页登录网页版
  • 河南省建设厅陈华平官方网站工商网查询企业信息查询系统
  • 做宣传页的网站采购管理
  • 吉林电商网站建设做母婴网站赚钱
  • 网站开发直播软件代码中可以做自己的网站吗
  • 自己做的网站二维码怎么做的高端企业网站建设核心
  • 建立电子商务网站目的织梦欧美网站模板
  • 做网站栏目都包括什么国外的一个大学生做的匿名社交网站
  • 竹子建设网站厦门网站代理
  • 用net语言做网站平台好不好wordpress 分类目录 标签转换器
  • 网站建设孝感wordpress建站网
  • 电脑网站在哪里找php餐饮网站
  • 陕西网站推广费用容桂做网站
  • 郑州网站推广公司案例贸易公司网站制作
  • 企业系统公示系统福州seo按天付费
  • 做网站需要的图片网站制作要求
  • 人防工程做资料的网站为什么说能进中交不进中建
  • 网站站长工具wordpress更换了域名
  • 做百科专用参考链接的网站wordpress实用插件
  • 网站开发应该怎么做wordpress文章添加seo标题