SSEで最適化し、処理領域の最小化を図ってなんとかならなくもない性能までもってきたはいいが、いまいち腑に落ちないのでいろいろいじっていたら、特殊なケースで場合分けして最適化すれば無茶苦茶速くなることに気がついた。実はその特殊なケースが今回の用途では全体の九割以上を占めているんだった。というわけで1枚26msから10msまで一気に削減。これならデフォルトで使えるレベルだ。特殊なケースに全く当てはまらないケースは簡単に作れてしまうのだけど、まあ、そういうときは従来のやりかたでやるということで。
SSEで最適化し、処理領域の最小化を図ってなんとかならなくもない性能までもってきたはいいが、いまいち腑に落ちないのでいろいろいじっていたら、特殊なケースで場合分けして最適化すれば無茶苦茶速くなることに気がついた。実はその特殊なケースが今回の用途では全体の九割以上を占めているんだった。というわけで1枚26msから10msまで一気に削減。これならデフォルトで使えるレベルだ。特殊なケースに全く当てはまらないケースは簡単に作れてしまうのだけど、まあ、そういうときは従来のやりかたでやるということで。
あの日見た夕日と風の色
ようやっとIA-32のSSEに手を出し始めました。先日からの問題のおかげで必要があるのと、そろそろP3が下限になってきたということで。何というか、ここまで新しいことを勉強する意欲がないってのはどうかと思うんですけどね。いや、これが遅延評価ってやつですよ! 必要になるまでやらない。
しかしこれは熱い。シャッフル命令萌え。