Merge remote-tracking branch 'qatar/master'
authorMichael Niedermayer <michaelni@gmx.at>
Fri, 8 Jun 2012 21:02:54 +0000 (23:02 +0200)
committerMichael Niedermayer <michaelni@gmx.at>
Fri, 8 Jun 2012 21:59:09 +0000 (23:59 +0200)
* qatar/master:
  float_dsp: ppc: add a separate header for Altivec function prototypes
  ARM: fix float_dsp breakage from d5a7229
  Add a float DSP framework to libavutil
  PPC: Move types_altivec.h and util_altivec.h from libavcodec to libavutil
  ARM: Move asm.S from libavcodec to libavutil
  vc1dsp: mark put/avg_vc1_mspel_mc() always_inline

Merged-by: Michael Niedermayer <michaelni@gmx.at>
73 files changed:
1  2 
libavcodec/aac.h
libavcodec/aacdec.c
libavcodec/aacenc.c
libavcodec/aacenc.h
libavcodec/ac3enc.c
libavcodec/ac3enc_fixed.c
libavcodec/ac3enc_float.c
libavcodec/ac3enc_template.c
libavcodec/arm/ac3dsp_neon.S
libavcodec/arm/dcadsp_neon.S
libavcodec/arm/dsputil_arm.S
libavcodec/arm/dsputil_armv6.S
libavcodec/arm/dsputil_init_neon.c
libavcodec/arm/dsputil_init_vfp.c
libavcodec/arm/dsputil_neon.S
libavcodec/arm/dsputil_vfp.S
libavcodec/arm/fft_fixed_neon.S
libavcodec/arm/fft_neon.S
libavcodec/arm/fmtconvert_neon.S
libavcodec/arm/fmtconvert_vfp.S
libavcodec/arm/h264dsp_neon.S
libavcodec/arm/h264idct_neon.S
libavcodec/arm/h264pred_neon.S
libavcodec/arm/int_neon.S
libavcodec/arm/mdct_neon.S
libavcodec/arm/mpegvideo_armv5te_s.S
libavcodec/arm/mpegvideo_neon.S
libavcodec/arm/rdft_neon.S
libavcodec/arm/simple_idct_arm.S
libavcodec/arm/simple_idct_armv5te.S
libavcodec/arm/simple_idct_armv6.S
libavcodec/arm/simple_idct_neon.S
libavcodec/arm/synth_filter_neon.S
libavcodec/arm/vp3dsp_neon.S
libavcodec/arm/vp56dsp_neon.S
libavcodec/arm/vp8_armv6.S
libavcodec/arm/vp8dsp_neon.S
libavcodec/atrac3.c
libavcodec/dsputil.c
libavcodec/dsputil.h
libavcodec/nellymoserenc.c
libavcodec/ppc/dsputil_altivec.c
libavcodec/ppc/fft_altivec.c
libavcodec/ppc/float_altivec.c
libavcodec/ppc/fmtconvert_altivec.c
libavcodec/ppc/gmc_altivec.c
libavcodec/ppc/h264_altivec.c
libavcodec/ppc/idct_altivec.c
libavcodec/ppc/int_altivec.c
libavcodec/ppc/mpegaudiodec_altivec.c
libavcodec/ppc/mpegvideo_altivec.c
libavcodec/ppc/vc1dsp_altivec.c
libavcodec/ppc/vp3dsp_altivec.c
libavcodec/ppc/vp8dsp_altivec.c
libavcodec/ra288.c
libavcodec/twinvq.c
libavcodec/vc1dsp.c
libavcodec/vorbisdec.c
libavcodec/x86/dsputil_mmx.c
libavcodec/x86/dsputil_yasm.asm
libavutil/Makefile
libavutil/arm/asm.S
libavutil/arm/float_dsp_arm.h
libavutil/arm/float_dsp_init_arm.c
libavutil/arm/float_dsp_init_vfp.c
libavutil/arm/float_dsp_vfp.S
libavutil/float_dsp.h
libavutil/ppc/float_dsp_altivec.c
libavutil/ppc/float_dsp_altivec.h
libavutil/ppc/float_dsp_init.c
libavutil/ppc/types_altivec.h
libavutil/ppc/util_altivec.h
libavutil/x86/float_dsp_init.c

Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
@@@ -172,9 -174,10 +174,10 @@@ static av_cold int encode_init(AVCodecC
      if ((ret = ff_mdct_init(&s->mdct_ctx, 8, 0, 32768.0)) < 0)
          goto error;
      ff_dsputil_init(&s->dsp, avctx);
+     avpriv_float_dsp_init(&s->fdsp, avctx->flags & CODEC_FLAG_BITEXACT);
  
      /* Generate overlap window */
 -    ff_sine_window_init(ff_sine_128, 128);
 +    ff_init_ff_sine_windows(7);
      for (i = 0; i < POW_TABLE_SIZE; i++)
          pow_table[i] = -pow(2, -i / 2048.0 - 3.0 + POW_TABLE_OFFSET);
  
Simple merge
   * Lesser General Public License for more details.
   *
   * You should have received a copy of the GNU Lesser General Public
 - * License along with Libav; if not, write to the Free Software
 + * License along with FFmpeg; if not, write to the Free Software
   * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
   */
+ #include "libavutil/ppc/types_altivec.h"
+ #include "libavutil/ppc/util_altivec.h"
  #include "libavcodec/fft.h"
- #include "util_altivec.h"
- #include "types_altivec.h"
  
  /**
   * Do a complex FFT with the parameters defined in ff_fft_init(). The
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
index 0000000,81fad3e..f3fafe3
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,29 +1,29 @@@
 - * This file is part of Libav.
+ /*
+  * Copyright (c) 2009 Mans Rullgard <mans@mansr.com>
+  *
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg.
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #ifndef AVUTIL_ARM_FLOAT_DSP_ARM_H
+ #define AVUTIL_ARM_FLOAT_DSP_ARM_H
+ #include "libavutil/float_dsp.h"
+ void ff_float_dsp_init_vfp (AVFloatDSPContext *fdsp);
+ void ff_float_dsp_init_neon(AVFloatDSPContext *fdsp);
+ #endif /* AVUTIL_ARM_FLOAT_DSP_ARM_H */
index 0000000,a352bec..ab636db
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,33 +1,33 @@@
 - * This file is part of Libav.
+ /*
+  * ARM optimized DSP utils
+  *
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg.
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #include "libavutil/arm/cpu.h"
+ #include "libavutil/float_dsp.h"
+ #include "float_dsp_arm.h"
+ void ff_float_dsp_init_arm(AVFloatDSPContext *fdsp)
+ {
+     int cpu_flags = av_get_cpu_flags();
+     if (have_vfp(cpu_flags))
+         ff_float_dsp_init_vfp(fdsp);
+     if (have_neon(cpu_flags))
+         ff_float_dsp_init_neon(fdsp);
+ }
index 0000000,30a9ce4..dfde3fd
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,34 +1,34 @@@
 - * This file is part of Libav.
+ /*
+  * Copyright (c) 2008 Siarhei Siamashka <ssvb@users.sourceforge.net>
+  *
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg.
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #include "libavutil/arm/cpu.h"
+ #include "libavutil/float_dsp.h"
+ #include "float_dsp_arm.h"
+ void ff_vector_fmul_vfp(float *dst, const float *src0, const float *src1,
+                         int len);
+ void ff_float_dsp_init_vfp(AVFloatDSPContext *fdsp)
+ {
+     int cpu_flags = av_get_cpu_flags();
+     if (!have_vfpv3(cpu_flags))
+         fdsp->vector_fmul = ff_vector_fmul_vfp;
+ }
index 0000000,3931828..db63e5a
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,68 +1,68 @@@
 - * This file is part of Libav.
+ /*
+  * Copyright (c) 2008 Siarhei Siamashka <ssvb@users.sourceforge.net>
+  *
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #include "config.h"
+ #include "asm.S"
+ /**
+  * Assume that len is a positive number and is multiple of 8
+  */
+ @ void ff_vector_fmul_vfp(float *dst, const float *src0, const float *src1, int len)
+ function ff_vector_fmul_vfp, export=1
+         vpush           {d8-d15}
+         fmrx            r12, fpscr
+         orr             r12, r12, #(3 << 16) /* set vector size to 4 */
+         fmxr            fpscr, r12
+         vldmia          r1!, {s0-s3}
+         vldmia          r2!, {s8-s11}
+         vldmia          r1!, {s4-s7}
+         vldmia          r2!, {s12-s15}
+         vmul.f32        s8,  s0,  s8
+ 1:
+         subs            r3,  r3,  #16
+         vmul.f32        s12, s4,  s12
+         itttt           ge
+         vldmiage        r1!, {s16-s19}
+         vldmiage        r2!, {s24-s27}
+         vldmiage        r1!, {s20-s23}
+         vldmiage        r2!, {s28-s31}
+         it              ge
+         vmulge.f32      s24, s16, s24
+         vstmia          r0!, {s8-s11}
+         vstmia          r0!, {s12-s15}
+         it              ge
+         vmulge.f32      s28, s20, s28
+         itttt           gt
+         vldmiagt        r1!, {s0-s3}
+         vldmiagt        r2!, {s8-s11}
+         vldmiagt        r1!, {s4-s7}
+         vldmiagt        r2!, {s12-s15}
+         ittt            ge
+         vmulge.f32      s8,  s0,  s8
+         vstmiage        r0!, {s24-s27}
+         vstmiage        r0!, {s28-s31}
+         bgt             1b
+         bic             r12, r12, #(7 << 16) /* set vector size back to 1 */
+         fmxr            fpscr, r12
+         vpop            {d8-d15}
+         bx              lr
+ endfunc
index 0000000,30161a2..02c4ab7
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,53 +1,53 @@@
 - * This file is part of Libav.
+ /*
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg.
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #ifndef AVUTIL_FLOAT_DSP_H
+ #define AVUTIL_FLOAT_DSP_H
+ typedef struct AVFloatDSPContext {
+     /**
+      * Calculate the product of two vectors of floats and store the result in
+      * a vector of floats.
+      *
+      * @param dst  output vector
+      *             constraints: 32-byte aligned
+      * @param src0 first input vector
+      *             constraints: 32-byte aligned
+      * @param src1 second input vector
+      *             constraints: 32-byte aligned
+      * @param len  number of elements in the input
+      *             constraints: multiple of 16
+      */
+     void (*vector_fmul)(float *dst, const float *src0, const float *src1,
+                         int len);
+ } AVFloatDSPContext;
+ /**
+  * Initialize a float DSP context.
+  *
+  * @param fdsp    float DSP context
+  * @param strict  setting to non-zero avoids using functions which may not be IEEE-754 compliant
+  */
+ void avpriv_float_dsp_init(AVFloatDSPContext *fdsp, int strict);
+ void ff_float_dsp_init_arm(AVFloatDSPContext *fdsp);
+ void ff_float_dsp_init_ppc(AVFloatDSPContext *fdsp, int strict);
+ void ff_float_dsp_init_x86(AVFloatDSPContext *fdsp);
+ #endif /* AVUTIL_FLOAT_DSP_H */
index 0000000,55e3fbe..6340e6c
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,38 +1,38 @@@
 - * This file is part of Libav.
+ /*
+  * Copyright (c) 2006 Luca Barbato <lu_zero@gentoo.org>
+  *
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg.
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #include "util_altivec.h"
+ #include "float_dsp_altivec.h"
+ void ff_vector_fmul_altivec(float *dst, const float *src0, const float *src1,
+                             int len)
+ {
+     int i;
+     vector float d0, d1, s, zero = (vector float)vec_splat_u32(0);
+     for (i = 0; i < len - 7; i += 8) {
+         d0 = vec_ld( 0, src0 + i);
+         s  = vec_ld( 0, src1 + i);
+         d1 = vec_ld(16, src0 + i);
+         d0 = vec_madd(d0, s, zero);
+         d1 = vec_madd(d1, vec_ld(16, src1 + i), zero);
+         vec_st(d0,  0, dst + i);
+         vec_st(d1, 16, dst + i);
+     }
+ }
index 0000000,0b9425b..20c89c2
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,27 +1,27 @@@
 - * This file is part of Libav.
+ /*
+  * Copyright (c) 2006 Luca Barbato <lu_zero@gentoo.org>
+  *
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg.
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #ifndef AVUTIL_PPC_FLOAT_DSP_ALTIVEC_H
+ #define AVUTIL_PPC_FLOAT_DSP_ALTIVEC_H
+ extern void ff_vector_fmul_altivec(float *dst, const float *src0,
+                                    const float *src1, int len);
+ #endif /* AVUTIL_PPC_FLOAT_DSP_ALTIVEC_H */
index 0000000,2052764..d0ae788
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,36 +1,36 @@@
 - * This file is part of Libav.
+ /*
+  * Copyright (c) 2006 Luca Barbato <lu_zero@gentoo.org>
+  *
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg.
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #include "config.h"
+ #include "libavutil/cpu.h"
+ #include "libavutil/float_dsp.h"
+ #include "float_dsp_altivec.h"
+ void ff_float_dsp_init_ppc(AVFloatDSPContext *fdsp, int bit_exact)
+ {
+ #if HAVE_ALTIVEC
+     int mm_flags = av_get_cpu_flags();
+     if (!(mm_flags & AV_CPU_FLAG_ALTIVEC))
+         return;
+     fdsp->vector_fmul = ff_vector_fmul_altivec;
+ #endif
+ }
Simple merge
Simple merge
index 0000000,10bb226..8f6980c
mode 000000,100644..100644
--- /dev/null
@@@ -1,0 -1,41 +1,41 @@@
 - * This file is part of Libav.
+ /*
 - * Libav is free software; you can redistribute it and/or
++ * This file is part of FFmpeg.
+  *
 - * Libav is distributed in the hope that it will be useful,
++ * FFmpeg is free software; you can redistribute it and/or
+  * modify it under the terms of the GNU Lesser General Public
+  * License as published by the Free Software Foundation; either
+  * version 2.1 of the License, or (at your option) any later version.
+  *
 - * License along with Libav; if not, write to the Free Software
++ * FFmpeg is distributed in the hope that it will be useful,
+  * but WITHOUT ANY WARRANTY; without even the implied warranty of
+  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+  * Lesser General Public License for more details.
+  *
+  * You should have received a copy of the GNU Lesser General Public
++ * License along with FFmpeg; if not, write to the Free Software
+  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
+  */
+ #include "config.h"
+ #include "libavutil/cpu.h"
+ #include "libavutil/float_dsp.h"
+ extern void ff_vector_fmul_sse(float *dst, const float *src0, const float *src1,
+                                int len);
+ extern void ff_vector_fmul_avx(float *dst, const float *src0, const float *src1,
+                                int len);
+ void ff_float_dsp_init_x86(AVFloatDSPContext *fdsp)
+ {
+ #if HAVE_YASM
+     int mm_flags = av_get_cpu_flags();
+     if (mm_flags & AV_CPU_FLAG_SSE && HAVE_SSE) {
+         fdsp->vector_fmul = ff_vector_fmul_sse;
+     }
+     if (mm_flags & AV_CPU_FLAG_AVX && HAVE_AVX) {
+         fdsp->vector_fmul = ff_vector_fmul_avx;
+     }
+ #endif
+ }