SSEで最適化し、処理領域の最小化を図ってなんとかならなくもない性能までもってきたはいいが、いまいち腑に落ちないのでいろいろいじっていたら、特殊なケースで場合分けして最適化すれば無茶苦茶速くなることに気がついた。実はその特殊なケースが今回の用途では全体の九割以上を占めているんだった。というわけで1枚26msから10msまで一気に削減。これならデフォルトで使えるレベルだ。特殊なケースに全く当てはまらないケースは簡単に作れてしまうのだけど、まあ、そういうときは従来のやりかたでやるということで。
SSEで最適化し、処理領域の最小化を図ってなんとかならなくもない性能までもってきたはいいが、いまいち腑に落ちないのでいろいろいじっていたら、特殊なケースで場合分けして最適化すれば無茶苦茶速くなることに気がついた。実はその特殊なケースが今回の用途では全体の九割以上を占めているんだった。というわけで1枚26msから10msまで一気に削減。これならデフォルトで使えるレベルだ。特殊なケースに全く当てはまらないケースは簡単に作れてしまうのだけど、まあ、そういうときは従来のやりかたでやるということで。