swr: int16->int32: use the old index negate trick to avoid 2 adds
authorMichael Niedermayer <michaelni@gmx.at>
Sat, 28 Apr 2012 15:03:20 +0000 (17:03 +0200)
committerMichael Niedermayer <michaelni@gmx.at>
Sat, 28 Apr 2012 15:06:11 +0000 (17:06 +0200)
Signed-off-by: Michael Niedermayer <michaelni@gmx.at>
libswresample/x86/audio_convert.asm

index 118b5e3..59de2d4 100644 (file)
@@ -35,18 +35,20 @@ cglobal int16_to_int32_%1, 3, 3, 3, dst, src, len
 %else
 int16_to_int32_u_int %+ SUFFIX
 %endif
+    add     dstq, lenq
+    shr     lenq, 1
+    add     srcq, lenq
+    neg     lenq
 .next
-    mov%1 m4, [srcq]
-    pxor m0, m0
-    pxor m1, m1
-    punpcklwd m0, m4
-    punpckhwd m1, m4
-    mov%1 [         dstq], m0
-    mov%1 [mmsize + dstq], m1
-    add srcq, mmsize
-    add dstq, 2*mmsize
-    sub lenq, 2*mmsize
-        jg .next
+    mov%1     m2, [srcq+lenq]
+    pxor      m0, m0
+    pxor      m1, m1
+    punpcklwd m0, m2
+    punpckhwd m1, m2
+    mov%1 [         dstq+2*lenq], m0
+    mov%1 [mmsize + dstq+2*lenq], m1
+    add lenq, mmsize
+        jl .next
 %if mmsize == 8
     emms
 %endif