assembly code 是變短了,但是速度反而變慢。
是因為 table 太大,無法放在 cache 的關係嗎?
無法瞭解MS的optimization 和 codegen. 為什麼
rgb565 = r | g | b;執行時間會比
*(unsigned int*)target_buf = rgb565;
rgb565 = (r<<11) | (g<<5) | (b>>3);來得慢..
*target_buf++ = (char)rgb565;
*target_buf = rgb565>>8;
沒有留言:
張貼留言