OSDN Git Service

avcodec/h264: mmx2, sse2, avx 10-bit h chroma deblock/loop filter
authorJames Darnley <jdarnley@obe.tv>
Wed, 30 Nov 2016 20:17:16 +0000 (21:17 +0100)
committerJames Darnley <jdarnley@obe.tv>
Tue, 6 Dec 2016 23:29:13 +0000 (00:29 +0100)
commitadd21d0bb3f5fb25fd5d1437eb746b91c2570a8f
tree0248af0697473989f2741366f15b3d614c60dabc
parent58ca2ef62e7c3e0b9f17d7ed3e435f996aa061fe
avcodec/h264: mmx2, sse2, avx 10-bit h chroma deblock/loop filter

Yorkfield:
 - mmx2: 2.45x (279 vs. 114 cycles)
 - sse2: 3.36x (279 vs.  83 cycles)

Nehalem:
 - mmx2: 2.10x (192 vs.  92 cycles)
 - sse2: 2.84x (192 vs.  68 cycles)

Skylake:
 - mmx2: 1.75x (170 vs.  97 cycles)
 - sse2: 2.47x (170 vs.  69 cycles)
 - avx:  2.47x (170 vs.  69 cycles)
libavcodec/x86/h264_deblock_10bit.asm
libavcodec/x86/h264dsp_init.c