OSDN Git Service

h264: new assembly version of get_cabac for x86_64 with PIC
authorRoland Scheidegger <rscheidegger_lists@hispeed.ch>
Fri, 27 Apr 2012 20:12:20 +0000 (22:12 +0200)
committerMichael Niedermayer <michaelni@gmx.at>
Sat, 28 Apr 2012 18:02:27 +0000 (20:02 +0200)
commit82c71913e46552f9b41ed3f63571b7777a999f68
treea0b43714aba491eb6f4b6096b3c901d51645bb55
parent7f668cd2b5f13afa0de9f593948ce2f703ab5aaa
h264: new assembly version of get_cabac for x86_64 with PIC

This adds a hand-optimized assembly version for get_cabac much like the
existing one, but it works if the table offsets are RIP-relative.
Compared to the non-RIP-relative version this adds 2 lea instructions
and it needs one extra register.
There is a surprisingly large performance improvement over the c version (more
so than the generated assembly seems to suggest) just in get_cabac, I measured
roughly 40% faster for get_cabac on a K8. However, overall the difference is
not that big, I measured roughly 5% on a test clip on a K8 and a Core2.
Hopefully it still compiles on x86 32bit...
Now that only one table is used, there's some chance even darwin as compiles
this (apparently the label arithmetic used previously doesn't work if it
involves symbols defined in a different file, thanks to Ronald S. Bultje for
helping me with this).

Signed-off-by: Michael Niedermayer <michaelni@gmx.at>
libavcodec/h264_cabac.c
libavcodec/x86/cabac.h
libavcodec/x86/h264_i386.h