libswresample: Change FLOAT_TO_INT32_N to need 1 register less
authorMichael Niedermayer <michaelni@gmx.at>
Sun, 13 May 2012 18:44:08 +0000 (20:44 +0200)
committerMichael Niedermayer <michaelni@gmx.at>
Sun, 13 May 2012 18:44:08 +0000 (20:44 +0200)
same speed on sandy bridge

Signed-off-by: Michael Niedermayer <michaelni@gmx.at>
libswresample/x86/audio_convert.asm

index fcf7ac1..b423a58 100644 (file)
@@ -321,12 +321,12 @@ pack_6ch_%2_to_%1_u_int %+ SUFFIX
 %macro FLOAT_TO_INT32_N 6
     mulps %1, %5
     mulps %2, %5
-    cvtps2dq  %3, %1
-    cvtps2dq  %4, %2
+    cvtps2dq  %6, %1
     cmpnltps %1, %5
+    paddd %1, %6
+    cvtps2dq  %6, %2
     cmpnltps %2, %5
-    paddd %1, %3
-    paddd %2, %4
+    paddd %2, %6
 %endmacro
 
 %macro INT16_TO_FLOAT_INIT 6