(昨日の続き)
MMXやアセンブラで検索すると、参考になるサイトがありましたので、そのサイトと睨めっこしつつアセンブラコードを書いてみました。
C言語の時は、アルファブレンド計算結果をあらかじめ配列(ルックアップテーブル?)につっこんでおいて、画像1と画像2のRGB値毎に、そのテーブルを参照して結果を求めるだけだったのですが、 MMXを使う場合は、そうしたルックアップテーブルを使う事が出来ず、毎回その場で計算しないといけなさそうだっため、本当に速くなるのか疑問でしたが、実際にやってみたところ、2倍以上の速度アップになりました!
test.LZH (718KB)
(今回から60FPSリミッターを外しています)
mmx pentium2 233MHz (昔のvaioノート)で、
2枚画像のアルファブレンド処理部分のFPSは、
C言語版:8~9FPS
MMX版:20FPS
・・・という結果になりました。
もちろん開発マシン(pentium4)では60FPSを超えています。
MMXを使うといくつかのデータに対して同じ処理を一度に出来るのですが、今回は掛け算なども使用する制限上、4つの数値を同時処理しています。
C言語の時に使ったルックアップテーブルは使えなくなったものの、この4つ同時処理が効いて、最終的に2倍程度になったようですね。
まだ改良の余地は多々有ると思いますが、とりあえずこの程度動けば、アドベンチャーゲームとしては成立するんじゃないかなぁと思いたいです。
(全画面アルファブレンドが出てくるシーンなんてあんまり無いでしょうから^^;)
実際にはBGM処理なども入るでしょうから、もうちょっとFPSは落ちると思いますので、動作環境はpentium2か3の500MHz以上(MMX必須)って所でしょうかね。
#ちょっと寄り道しすぎたので、EDGE2開発に戻ります。