(昨日の続き)
MMXやアセンブラで検索すると、参考になるサイトがありましたので、そのサイトと睨めっこしつつアセンブラコードを書いてみました。

C言語の時は、アルファブレンド計算結果をあらかじめ配列(ルックアップテーブル?)につっこんでおいて、画像1と画像2のRGB値毎に、そのテーブルを参照して結果を求めるだけだったのですが、 MMXを使う場合は、そうしたルックアップテーブルを使う事が出来ず、毎回その場で計算しないといけなさそうだっため、本当に速くなるのか疑問でしたが、実際にやってみたところ、2倍以上の速度アップになりました!

test.LZH (718KB)

(今回から60FPSリミッターを外しています)

mmx pentium2 233MHz (昔のvaioノート)で、
2枚画像のアルファブレンド処理部分のFPSは、

C言語版:8~9FPS
MMX版:20FPS

・・・という結果になりました。

もちろん開発マシン(pentium4)では60FPSを超えています。

MMXを使うといくつかのデータに対して同じ処理を一度に出来るのですが、今回は掛け算なども使用する制限上、4つの数値を同時処理しています。

C言語の時に使ったルックアップテーブルは使えなくなったものの、この4つ同時処理が効いて、最終的に2倍程度になったようですね。

まだ改良の余地は多々有ると思いますが、とりあえずこの程度動けば、アドベンチャーゲームとしては成立するんじゃないかなぁと思いたいです。
(全画面アルファブレンドが出てくるシーンなんてあんまり無いでしょうから^^;)

実際にはBGM処理なども入るでしょうから、もうちょっとFPSは落ちると思いますので、動作環境はpentium2か3の500MHz以上(MMX必須)って所でしょうかね。

#ちょっと寄り道しすぎたので、EDGE2開発に戻ります。

記事検索

アーカイブ