OSDN Git Service

libavutil: Add ARM av_clip_intp2_arm
authorPeter Meerwald <pmeerw@pmeerw.net>
Fri, 20 Feb 2015 00:35:34 +0000 (01:35 +0100)
committerLuca Barbato <lu_zero@gentoo.org>
Fri, 20 Feb 2015 23:54:40 +0000 (00:54 +0100)
add ARM code for implementing av_clip_intp2 using the ssat instruction

on Cortex-A8, av_clip_intp2_arm() is faster than av_clip_intp2_c() and
the generic av_clip(), about -19%

Signed-off-by: Peter Meerwald <pmeerw@pmeerw.net>
Signed-off-by: Luca Barbato <lu_zero@gentoo.org>
libavutil/arm/intmath.h

index 56fcdb3..2b15ba0 100644 (file)
@@ -62,6 +62,14 @@ static av_always_inline av_const int av_clip_int16_arm(int a)
     return x;
 }
 
+#define av_clip_intp2 av_clip_intp2_arm
+static av_always_inline av_const int av_clip_intp2_arm(int a, int p)
+{
+    unsigned x;
+    __asm__ ("ssat %0, %2, %1" : "=r"(x) : "r"(a), "i"(p+1));
+    return x;
+}
+
 #define av_clip_uintp2 av_clip_uintp2_arm
 static av_always_inline av_const unsigned av_clip_uintp2_arm(int a, int p)
 {