OSDN Git Service

vp9/x86: idct_add_16x16_ssse3.
authorRonald S. Bultje <rsbultje@gmail.com>
Sat, 14 Dec 2013 13:09:18 +0000 (08:09 -0500)
committerRonald S. Bultje <rsbultje@gmail.com>
Sat, 14 Dec 2013 17:13:26 +0000 (12:13 -0500)
commit8d4c616fc05f2f3c76d13594788129df72069f30
tree97df1c49ee90fc77f708641e3d46297be84c8597
parentc65fe9e9822cf2a04e5507ddbb7f99e4b6cd93e9
vp9/x86: idct_add_16x16_ssse3.

Currently only dc-only and full 16x16. Other subforms will follow in the
near future. Total decoding time of ped1080p.webm goes from 9.7 to 9.3
seconds. DC-only goes from 957 -> 131 cycles, and the full IDCT goes
from ~4050 to ~745 cycles.
libavcodec/x86/vp9dsp_init.c
libavcodec/x86/vp9itxfm.asm