osd_template.c: Add intrinsic based SSE2 support.
authorreimar <reimar@b3059339-0415-0410-9bf9-f77b7e298cf2>
Mon, 27 May 2019 20:02:12 +0000 (20:02 +0000)
committerreimar <reimar@b3059339-0415-0410-9bf9-f77b7e298cf2>
Mon, 27 May 2019 20:02:12 +0000 (20:02 +0000)
commit24057d63914d54ccb05e8dfdd7dec83da81f9524
tree4ea8fb25c2dd6f0a48574aee489d6530d60adceb
parentb17167d7d95c3677dd733182eec7b9265a4e2c0e
osd_template.c: Add intrinsic based SSE2 support.

Intrinsics are not well liked for good reason,
but it is much faster to implement and compilers
are no longer completely horrible for x86.
Speed is about 2x-3x and it matches the C code instead
of the less accurate MMX code.
Primary motivation is though that MMX is starting to
have worse and worse support in CPUs.
To benchmark, use this command and remove the reading code
from rawvideo and the memcpy_pic from vf_expand.
./mplayer /dev/zero -demuxer rawvideo -rawvideo w=1920:h=1080:format=yuy2 -vo null -osdlevel 3 -benchmark -quiet -frames 50000 -vf expand=osd=1 -subfont-osd-scale 20

git-svn-id: svn://git.mplayerhq.hu/mplayer/trunk@38143 b3059339-0415-0410-9bf9-f77b7e298cf2
configure
sub/osd.c
sub/osd_template.c
sub/sub.c