OSDN Git Service

lavr: x86: improve non-SSE4 version of S16_TO_S32_SX macro
authorJustin Ruggles <justin.ruggles@gmail.com>
Tue, 26 Jun 2012 20:50:10 +0000 (16:50 -0400)
committerJustin Ruggles <justin.ruggles@gmail.com>
Fri, 27 Jul 2012 18:21:32 +0000 (14:21 -0400)
Removes a false dependency on existing contents of the 2nd dst register,
giving better performance for OOE.

libavresample/x86/util.asm

index 501f662..ca7fde5 100644 (file)
@@ -26,7 +26,8 @@
     pmovsxwd     m%1, m%1
     SWAP %1, %2
 %else
-    punpckhwd    m%2, m%1
+    mova         m%2, m%1
+    punpckhwd    m%2, m%2
     punpcklwd    m%1, m%1
     psrad        m%2, 16
     psrad        m%1, 16