2.11.2009

無法瞭解MS的optimization

結果使用"雙查表",速度反而變慢。
assembly code 是變短了,但是速度反而變慢。
是因為 table 太大,無法放在 cache 的關係嗎?

無法瞭解MS的optimization 和 codegen. 為什麼
 rgb565 = r | g | b;
*(unsigned int*)target_buf = rgb565;
執行時間會比
 rgb565 = (r<<11) | (g<<5) | (b>>3);
*target_buf++ = (char)rgb565;
*target_buf = rgb565>>8;
來得慢..

沒有留言: