- optimze with speed
 - 盡量使用 mla ( a = (b*c)+d))
 - 盡量不使用 condition jump
 - 反組譯
 - exam asm - 盡量使用所有 register
 - 打亂 instruction. 混合 register only arithematic 和 data load/store
 
- 先照 assembly algorithm 寫出 c code. - cpu % , 1000 loop time.
 - 反組譯, 寫成 .S link - 確認 work
 - follow yuv420_rgb565.s 略為修改,但不作 scramble - cpu %, 1000 loop time.
 - 作 scamble, 混合 load/store 和 register only instruction. - cpu %, 1000 loop time
 
沒有留言:
張貼留言