OSDN Git Service

Merge remote-tracking branch 'qatar/master'
authorMichael Niedermayer <michaelni@gmx.at>
Mon, 23 Apr 2012 22:19:55 +0000 (00:19 +0200)
committerMichael Niedermayer <michaelni@gmx.at>
Tue, 24 Apr 2012 00:30:41 +0000 (02:30 +0200)
* qatar/master:
  matroska: Clear prev_pkt between seeks.
  avutil: change default buffer size alignment for sample buffer functions
  audemux: Add a sanity check for the number of channels
  Remove libdirac decoder.
  matroska: Add incremental parsing of clusters.
  avconv: fix off by one check in complex_filter
  mpegts: Try seeking back even for nonseekable protocols
  swscale: K&R formatting cosmetics (part III)

Conflicts:
configure
doc/general.texi
doc/platform.texi
ffmpeg.c
libavcodec/Makefile
libavcodec/allcodecs.c
libavcodec/libdirac.h
libavcodec/libdiracdec.c
libavformat/au.c
libavformat/mpegts.c
libswscale/input.c
tests/ref/seek/lavf_mkv

Merged-by: Michael Niedermayer <michaelni@gmx.at>
1  2 
configure
doc/general.texi
doc/platform.texi
libavcodec/Makefile
libavcodec/allcodecs.c
libavformat/au.c
libavformat/matroskadec.c
libavutil/samplefmt.c
libswscale/input.c
tests/ref/seek/lavf_mkv

diff --cc configure
+++ b/configure
@@@ -1029,13 -940,8 +1028,12 @@@ CONFIG_LIST=
      gpl
      gray
      hardcoded_tables
 +    libaacplus
 +    libass
 +    libbluray
      libcdio
 +    libcelt
      libdc1394
-     libdirac
      libfaac
      libfreetype
      libgsm
@@@ -1555,9 -1420,6 +1553,8 @@@ vdpau_deps="vdpau_vdpau_h vdpau_vdpau_x
  h264_parser_select="golomb h264dsp h264pred"
  
  # external libraries
- libdirac_decoder_deps="libdirac !libschroedinger"
 +libaacplus_encoder_deps="libaacplus"
 +libcelt_decoder_deps="libcelt"
  libfaac_encoder_deps="libfaac"
  libgsm_decoder_deps="libgsm"
  libgsm_encoder_deps="libgsm"
@@@ -3191,18 -2958,8 +3188,15 @@@ check_mathfunc trunc
  
  # these are off by default, so fail if requested and not available
  enabled avisynth   && require2 vfw32 "windows.h vfw.h" AVIFileInit -lavifil32
 +enabled fontconfig && require_pkg_config fontconfig "fontconfig/fontconfig.h" FcInit
  enabled frei0r     && { check_header frei0r.h || die "ERROR: frei0r.h header not found"; }
  enabled gnutls     && require_pkg_config gnutls gnutls/gnutls.h gnutls_global_init
- enabled libdirac   && require_pkg_config dirac                          \
-     "libdirac_decoder/dirac_parser.h"  \
-     "dirac_decoder_init"
 +enabled libaacplus && require  "libaacplus >= 2.0.0" aacplus.h aacplusEncOpen -laacplus
 +enabled libass     && require_pkg_config libass ass/ass.h ass_library_init
 +enabled libbluray  && require libbluray libbluray/bluray.h bd_open -lbluray
 +enabled libcelt    && require libcelt celt/celt.h celt_decode -lcelt0 &&
 +                      { check_lib celt/celt.h celt_decoder_create_custom -lcelt0 ||
 +                        die "ERROR: libcelt version must be >= 0.11.0."; }
  enabled libfaac    && require2 libfaac "stdint.h faac.h" faacEncGetVersion -lfaac
  enabled libfreetype && require_pkg_config freetype2 "ft2build.h freetype/freetype.h" FT_Init_FreeType
  enabled libgsm     && require  libgsm gsm/gsm.h gsm_create -lgsm
@@@ -3567,15 -3247,10 +3561,14 @@@ echo "libvdpau enabled          ${vdpau
  echo "AVISynth enabled          ${avisynth-no}"
  echo "frei0r enabled            ${frei0r-no}"
  echo "gnutls enabled            ${gnutls-no}"
 +echo "libaacplus enabled        ${libaacplus-no}"
 +echo "libass enabled            ${libass-no}"
  echo "libcdio support           ${libcdio-no}"
 +echo "libcelt enabled           ${libcelt-no}"
  echo "libdc1394 support         ${libdc1394-no}"
- echo "libdirac enabled          ${libdirac-no}"
  echo "libfaac enabled           ${libfaac-no}"
  echo "libgsm enabled            ${libgsm-no}"
 +echo "libmodplug enabled        ${libmodplug-no}"
  echo "libmp3lame enabled        ${libmp3lame-no}"
  echo "libnut enabled            ${libnut-no}"
  echo "libopencore-amrnb support ${libopencore_amrnb-no}"
@@@ -481,8 -453,8 +481,8 @@@ following image formats are supported
  @item Creative YUV (CYUV)    @tab     @tab  X
  @item DFA                    @tab     @tab  X
      @tab Codec used in Chronomaster game.
 -@item Dirac                  @tab  E  @tab  E
 +@item Dirac                  @tab  E  @tab  X
-     @tab supported through external libdirac/libschroedinger libraries
+     @tab supported through external library libschroedinger
  @item Deluxe Paint Animation @tab     @tab  X
  @item DNxHD                  @tab   X @tab  X
      @tab aka SMPTE VC3
@@@ -354,9 -323,8 +354,8 @@@ These library packages are only availab
  @uref{http://sourceware.org/cygwinports/, Cygwin Ports}:
  
  @example
- yasm, libSDL-devel, libdirac-devel, libfaac-devel, libaacplus-devel, libgsm-devel,
- libmp3lame-devel, libschroedinger1.0-devel, speex-devel, libtheora-devel,
- libxvidcore-devel
 -yasm, libSDL-devel, libfaac-devel, libgsm-devel, libmp3lame-devel,
++yasm, libSDL-devel, libfaac-devel, libaacplus-devel, libgsm-devel, libmp3lame-devel,
+ libschroedinger1.0-devel, speex-devel, libtheora-devel, libxvidcore-devel
  @end example
  
  The recommendation for libnut and x264 is to build them from source by
@@@ -632,9 -582,6 +632,8 @@@ OBJS-$(CONFIG_WEBM_MUXER)              
  OBJS-$(CONFIG_WTV_DEMUXER)             += mpeg4audio.o mpegaudiodata.o
  
  # external codec libraries
- OBJS-$(CONFIG_LIBDIRAC_DECODER)           += libdiracdec.o
 +OBJS-$(CONFIG_LIBAACPLUS_ENCODER)         += libaacplus.o
 +OBJS-$(CONFIG_LIBCELT_DECODER)            += libcelt_dec.o
  OBJS-$(CONFIG_LIBFAAC_ENCODER)            += libfaac.o audio_frame_queue.o
  OBJS-$(CONFIG_LIBGSM_DECODER)             += libgsm.o
  OBJS-$(CONFIG_LIBGSM_ENCODER)             += libgsm.o
@@@ -402,8 -375,6 +402,7 @@@ void avcodec_register_all(void
      REGISTER_ENCDEC  (XSUB, xsub);
  
      /* external libraries */
-     REGISTER_DECODER (LIBDIRAC, libdirac);
 +    REGISTER_DECODER (LIBCELT, libcelt);
      REGISTER_ENCODER (LIBFAAC, libfaac);
      REGISTER_ENCDEC  (LIBGSM, libgsm);
      REGISTER_ENCDEC  (LIBGSM_MS, libgsm_ms);
Simple merge
@@@ -543,38 -521,40 +550,70 @@@ static EbmlSyntax matroska_clusters[] 
      { 0 }
  };
  
+ static EbmlSyntax matroska_cluster_incremental_parsing[] = {
+     { MATROSKA_ID_CLUSTERTIMECODE,EBML_UINT,0, offsetof(MatroskaCluster,timecode) },
+     { MATROSKA_ID_BLOCKGROUP,     EBML_NEST, sizeof(MatroskaBlock), offsetof(MatroskaCluster,blocks), {.n=matroska_blockgroup} },
+     { MATROSKA_ID_SIMPLEBLOCK,    EBML_PASS, sizeof(MatroskaBlock), offsetof(MatroskaCluster,blocks), {.n=matroska_blockgroup} },
+     { MATROSKA_ID_CLUSTERPOSITION,EBML_NONE },
+     { MATROSKA_ID_CLUSTERPREVSIZE,EBML_NONE },
+     { MATROSKA_ID_INFO,           EBML_NONE },
+     { MATROSKA_ID_CUES,           EBML_NONE },
+     { MATROSKA_ID_TAGS,           EBML_NONE },
+     { MATROSKA_ID_SEEKHEAD,       EBML_NONE },
+     { MATROSKA_ID_CLUSTER,        EBML_STOP },
+     { 0 }
+ };
+ static EbmlSyntax matroska_cluster_incremental[] = {
+     { MATROSKA_ID_CLUSTERTIMECODE,EBML_UINT,0, offsetof(MatroskaCluster,timecode) },
+     { MATROSKA_ID_BLOCKGROUP,     EBML_STOP },
+     { MATROSKA_ID_SIMPLEBLOCK,    EBML_STOP },
+     { MATROSKA_ID_CLUSTERPOSITION,EBML_NONE },
+     { MATROSKA_ID_CLUSTERPREVSIZE,EBML_NONE },
+     { 0 }
+ };
+ static EbmlSyntax matroska_clusters_incremental[] = {
+     { MATROSKA_ID_CLUSTER,        EBML_NEST, 0, 0, {.n=matroska_cluster_incremental} },
+     { MATROSKA_ID_INFO,           EBML_NONE },
+     { MATROSKA_ID_CUES,           EBML_NONE },
+     { MATROSKA_ID_TAGS,           EBML_NONE },
+     { MATROSKA_ID_SEEKHEAD,       EBML_NONE },
+     { 0 }
+ };
  static const char *const matroska_doctypes[] = { "matroska", "webm" };
  
 +static int matroska_resync(MatroskaDemuxContext *matroska, int64_t last_pos)
 +{
 +    AVIOContext *pb = matroska->ctx->pb;
 +    uint32_t id;
 +    matroska->current_id = 0;
 +    matroska->num_levels = 0;
 +
 +    // seek to next position to resync from
 +    if (avio_seek(pb, last_pos + 1, SEEK_SET) < 0 || avio_tell(pb) <= last_pos)
 +        goto eof;
 +
 +    id = avio_rb32(pb);
 +
 +    // try to find a toplevel element
 +    while (!url_feof(pb)) {
 +        if (id == MATROSKA_ID_INFO || id == MATROSKA_ID_TRACKS ||
 +            id == MATROSKA_ID_CUES || id == MATROSKA_ID_TAGS ||
 +            id == MATROSKA_ID_SEEKHEAD || id == MATROSKA_ID_ATTACHMENTS ||
 +            id == MATROSKA_ID_CLUSTER || id == MATROSKA_ID_CHAPTERS)
 +        {
 +            matroska->current_id = id;
 +            return 0;
 +        }
 +        id = (id << 8) | avio_r8(pb);
 +    }
 +eof:
 +    matroska->done = 1;
 +    return AVERROR_EOF;
 +}
 +
  /*
   * Return: Whether we reached the end of a level in the hierarchy or not.
   */
@@@ -1822,7 -1732,7 +1864,8 @@@ static int matroska_parse_block(Matrosk
      st = track->stream;
      if (st->discard >= AVDISCARD_ALL)
          return res;
 -    if (duration == AV_NOPTS_VALUE)
++    av_assert1(duration != AV_NOPTS_VALUE);
 +    if (!duration)
          duration = track->default_duration / matroska->time_scale;
  
      block_time = AV_RB16(data);
      return res;
  }
  
 -                blocks[i].duration = AV_NOPTS_VALUE;
+ static int matroska_parse_cluster_incremental(MatroskaDemuxContext *matroska)
+ {
+     EbmlList *blocks_list;
+     MatroskaBlock *blocks;
+     int i, res;
+     res = ebml_parse(matroska,
+                      matroska_cluster_incremental_parsing,
+                      &matroska->current_cluster);
+     if (res == 1) {
+         /* New Cluster */
+         if (matroska->current_cluster_pos)
+             ebml_level_end(matroska);
+         ebml_free(matroska_cluster, &matroska->current_cluster);
+         memset(&matroska->current_cluster, 0, sizeof(MatroskaCluster));
+         matroska->current_cluster_num_blocks = 0;
+         matroska->current_cluster_pos = avio_tell(matroska->ctx->pb);
+         matroska->prev_pkt = NULL;
+         /* sizeof the ID which was already read */
+         if (matroska->current_id)
+             matroska->current_cluster_pos -= 4;
+         res = ebml_parse(matroska,
+                          matroska_clusters_incremental,
+                          &matroska->current_cluster);
+         /* Try parsing the block again. */
+         if (res == 1)
+             res = ebml_parse(matroska,
+                              matroska_cluster_incremental_parsing,
+                              &matroska->current_cluster);
+     }
+     if (!res &&
+         matroska->current_cluster_num_blocks <
+             matroska->current_cluster.blocks.nb_elem) {
+         blocks_list = &matroska->current_cluster.blocks;
+         blocks = blocks_list->elem;
+         matroska->current_cluster_num_blocks = blocks_list->nb_elem;
+         i = blocks_list->nb_elem - 1;
+         if (blocks[i].bin.size > 0 && blocks[i].bin.data) {
+             int is_keyframe = blocks[i].non_simple ? !blocks[i].reference : -1;
+             if (!blocks[i].non_simple)
++                blocks[i].duration = 0;
+             res = matroska_parse_block(matroska,
+                                        blocks[i].bin.data, blocks[i].bin.size,
+                                        blocks[i].bin.pos,
+                                        matroska->current_cluster.timecode,
+                                        blocks[i].duration, is_keyframe,
+                                        matroska->current_cluster_pos);
+         }
+     }
+     if (res < 0)  matroska->done = 1;
+     return res;
+ }
  static int matroska_parse_cluster(MatroskaDemuxContext *matroska)
  {
      MatroskaCluster cluster = { 0 };
Simple merge
  #define r ((origin == PIX_FMT_BGR48BE || origin == PIX_FMT_BGR48LE) ? b_r : r_b)
  #define b ((origin == PIX_FMT_BGR48BE || origin == PIX_FMT_BGR48LE) ? r_b : b_r)
  
- static av_always_inline void
- rgb48ToY_c_template(uint16_t *dst, const uint16_t *src, int width,
-                     enum PixelFormat origin)
 +static av_always_inline void
 +rgb64ToY_c_template(uint16_t *dst, const uint16_t *src, int width,
 +                    enum PixelFormat origin)
 +{
 +    int i;
 +    for (i = 0; i < width; i++) {
 +        unsigned int r_b = input_pixel(&src[i*4+0]);
 +        unsigned int   g = input_pixel(&src[i*4+1]);
 +        unsigned int b_r = input_pixel(&src[i*4+2]);
 +
 +        dst[i] = (RY*r + GY*g + BY*b + (0x2001<<(RGB2YUV_SHIFT-1))) >> RGB2YUV_SHIFT;
 +    }
 +}
 +
 +static av_always_inline void
 +rgb64ToUV_c_template(uint16_t *dstU, uint16_t *dstV,
 +                    const uint16_t *src1, const uint16_t *src2,
 +                    int width, enum PixelFormat origin)
 +{
 +    int i;
 +    assert(src1==src2);
 +    for (i = 0; i < width; i++) {
 +        int r_b = input_pixel(&src1[i*4+0]);
 +        int   g = input_pixel(&src1[i*4+1]);
 +        int b_r = input_pixel(&src1[i*4+2]);
 +
 +        dstU[i] = (RU*r + GU*g + BU*b + (0x10001<<(RGB2YUV_SHIFT-1))) >> RGB2YUV_SHIFT;
 +        dstV[i] = (RV*r + GV*g + BV*b + (0x10001<<(RGB2YUV_SHIFT-1))) >> RGB2YUV_SHIFT;
 +    }
 +}
 +
 +static av_always_inline void
 +rgb64ToUV_half_c_template(uint16_t *dstU, uint16_t *dstV,
 +                          const uint16_t *src1, const uint16_t *src2,
 +                          int width, enum PixelFormat origin)
 +{
 +    int i;
 +    assert(src1==src2);
 +    for (i = 0; i < width; i++) {
 +        int r_b = (input_pixel(&src1[8 * i + 0]) + input_pixel(&src1[8 * i + 4]) + 1) >> 1;
 +        int   g = (input_pixel(&src1[8 * i + 1]) + input_pixel(&src1[8 * i + 5]) + 1) >> 1;
 +        int b_r = (input_pixel(&src1[8 * i + 2]) + input_pixel(&src1[8 * i + 6]) + 1) >> 1;
 +
 +        dstU[i]= (RU*r + GU*g + BU*b + (0x10001<<(RGB2YUV_SHIFT-1))) >> RGB2YUV_SHIFT;
 +        dstV[i]= (RV*r + GV*g + BV*b + (0x10001<<(RGB2YUV_SHIFT-1))) >> RGB2YUV_SHIFT;
 +    }
 +}
 +
 +#define rgb64funcs(pattern, BE_LE, origin) \
 +static void pattern ## 64 ## BE_LE ## ToY_c(uint8_t *_dst, const uint8_t *_src, const uint8_t *unused0, const uint8_t *unused1,\
 +                                    int width, uint32_t *unused) \
 +{ \
 +    const uint16_t *src = (const uint16_t *) _src; \
 +    uint16_t *dst = (uint16_t *) _dst; \
 +    rgb64ToY_c_template(dst, src, width, origin); \
 +} \
 + \
 +static void pattern ## 64 ## BE_LE ## ToUV_c(uint8_t *_dstU, uint8_t *_dstV, \
 +                                    const uint8_t *unused0, const uint8_t *_src1, const uint8_t *_src2, \
 +                                    int width, uint32_t *unused) \
 +{ \
 +    const uint16_t *src1 = (const uint16_t *) _src1, \
 +                   *src2 = (const uint16_t *) _src2; \
 +    uint16_t *dstU = (uint16_t *) _dstU, *dstV = (uint16_t *) _dstV; \
 +    rgb64ToUV_c_template(dstU, dstV, src1, src2, width, origin); \
 +} \
 + \
 +static void pattern ## 64 ## BE_LE ## ToUV_half_c(uint8_t *_dstU, uint8_t *_dstV, \
 +                                    const uint8_t *unused0, const uint8_t *_src1, const uint8_t *_src2, \
 +                                    int width, uint32_t *unused) \
 +{ \
 +    const uint16_t *src1 = (const uint16_t *) _src1, \
 +                   *src2 = (const uint16_t *) _src2; \
 +    uint16_t *dstU = (uint16_t *) _dstU, *dstV = (uint16_t *) _dstV; \
 +    rgb64ToUV_half_c_template(dstU, dstV, src1, src2, width, origin); \
 +}
 +
 +rgb64funcs(rgb, LE, PIX_FMT_RGBA64LE)
 +rgb64funcs(rgb, BE, PIX_FMT_RGBA64BE)
 +
+ static av_always_inline void rgb48ToY_c_template(uint16_t *dst,
+                                                  const uint16_t *src, int width,
+                                                  enum PixelFormat origin)
  {
      int i;
      for (i = 0; i < width; i++) {
@@@ -183,33 -110,43 +190,46 @@@ static av_always_inline void rgb48ToUV_
  #undef b
  #undef input_pixel
  
- #define rgb48funcs(pattern, BE_LE, origin) \
- static void pattern ## 48 ## BE_LE ## ToY_c(uint8_t *_dst, const uint8_t *_src, const uint8_t *unused0, const uint8_t *unused1,\
-                                     int width, uint32_t *unused) \
- { \
-     const uint16_t *src = (const uint16_t *) _src; \
-     uint16_t *dst = (uint16_t *) _dst; \
-     rgb48ToY_c_template(dst, src, width, origin); \
- } \
-  \
- static void pattern ## 48 ## BE_LE ## ToUV_c(uint8_t *_dstU, uint8_t *_dstV, \
-                                     const uint8_t *unused0, const uint8_t *_src1, const uint8_t *_src2, \
-                                     int width, uint32_t *unused) \
- { \
-     const uint16_t *src1 = (const uint16_t *) _src1, \
-                    *src2 = (const uint16_t *) _src2; \
-     uint16_t *dstU = (uint16_t *) _dstU, *dstV = (uint16_t *) _dstV; \
-     rgb48ToUV_c_template(dstU, dstV, src1, src2, width, origin); \
- } \
-  \
- static void pattern ## 48 ## BE_LE ## ToUV_half_c(uint8_t *_dstU, uint8_t *_dstV, \
-                                     const uint8_t *unused0, const uint8_t *_src1, const uint8_t *_src2, \
-                                     int width, uint32_t *unused) \
- { \
-     const uint16_t *src1 = (const uint16_t *) _src1, \
-                    *src2 = (const uint16_t *) _src2; \
-     uint16_t *dstU = (uint16_t *) _dstU, *dstV = (uint16_t *) _dstV; \
-     rgb48ToUV_half_c_template(dstU, dstV, src1, src2, width, origin); \
+ #define rgb48funcs(pattern, BE_LE, origin)                              \
+ static void pattern ## 48 ## BE_LE ## ToY_c(uint8_t *_dst,              \
+                                             const uint8_t *_src,        \
++                                            const uint8_t *unused0, const uint8_t *unused1,\
+                                             int width,                  \
+                                             uint32_t *unused)           \
+ {                                                                       \
+     const uint16_t *src = (const uint16_t *)_src;                       \
+     uint16_t *dst       = (uint16_t *)_dst;                             \
+     rgb48ToY_c_template(dst, src, width, origin);                       \
+ }                                                                       \
+                                                                         \
+ static void pattern ## 48 ## BE_LE ## ToUV_c(uint8_t *_dstU,            \
+                                              uint8_t *_dstV,            \
++                                             const uint8_t *unused0,    \
+                                              const uint8_t *_src1,      \
+                                              const uint8_t *_src2,      \
+                                              int width,                 \
+                                              uint32_t *unused)          \
+ {                                                                       \
+     const uint16_t *src1 = (const uint16_t *)_src1,                     \
+                    *src2 = (const uint16_t *)_src2;                     \
+     uint16_t *dstU = (uint16_t *)_dstU,                                 \
+              *dstV = (uint16_t *)_dstV;                                 \
+     rgb48ToUV_c_template(dstU, dstV, src1, src2, width, origin);        \
+ }                                                                       \
+                                                                         \
+ static void pattern ## 48 ## BE_LE ## ToUV_half_c(uint8_t *_dstU,       \
+                                                   uint8_t *_dstV,       \
++                                                  const uint8_t *unused0,    \
+                                                   const uint8_t *_src1, \
+                                                   const uint8_t *_src2, \
+                                                   int width,            \
+                                                   uint32_t *unused)     \
+ {                                                                       \
+     const uint16_t *src1 = (const uint16_t *)_src1,                     \
+                    *src2 = (const uint16_t *)_src2;                     \
+     uint16_t *dstU = (uint16_t *)_dstU,                                 \
+              *dstV = (uint16_t *)_dstV;                                 \
+     rgb48ToUV_half_c_template(dstU, dstV, src1, src2, width, origin);   \
  }
  
  rgb48funcs(rgb, LE, PIX_FMT_RGB48LE)
@@@ -217,70 -154,85 +237,85 @@@ rgb48funcs(rgb, BE, PIX_FMT_RGB48BE
  rgb48funcs(bgr, LE, PIX_FMT_BGR48LE)
  rgb48funcs(bgr, BE, PIX_FMT_BGR48BE)
  
- #define input_pixel(i) ((origin == PIX_FMT_RGBA || origin == PIX_FMT_BGRA || \
-                          origin == PIX_FMT_ARGB || origin == PIX_FMT_ABGR) ? AV_RN32A(&src[(i)*4]) : \
-                         (isBE(origin) ? AV_RB16(&src[(i)*2]) : AV_RL16(&src[(i)*2])))
- static av_always_inline void
- rgb16_32ToY_c_template(int16_t *dst, const uint8_t *src,
-                        int width, enum PixelFormat origin,
-                        int shr,   int shg,   int shb, int shp,
-                        int maskr, int maskg, int maskb,
-                        int rsh,   int gsh,   int bsh, int S)
+ #define input_pixel(i) ((origin == PIX_FMT_RGBA ||                      \
+                          origin == PIX_FMT_BGRA ||                      \
+                          origin == PIX_FMT_ARGB ||                      \
+                          origin == PIX_FMT_ABGR)                        \
+                         ? AV_RN32A(&src[(i) * 4])                       \
+                         : (isBE(origin) ? AV_RB16(&src[(i) * 2])        \
+                                         : AV_RL16(&src[(i) * 2])))
 -static av_always_inline void rgb16_32ToY_c_template(uint8_t *dst,
++static av_always_inline void rgb16_32ToY_c_template(int16_t *dst,
+                                                     const uint8_t *src,
+                                                     int width,
+                                                     enum PixelFormat origin,
+                                                     int shr, int shg,
+                                                     int shb, int shp,
+                                                     int maskr, int maskg,
+                                                     int maskb, int rsh,
+                                                     int gsh, int bsh, int S)
  {
-     const int ry = RY << rsh, gy = GY << gsh, by = BY << bsh;
+     const int ry       = RY << rsh, gy = GY << gsh, by = BY << bsh;
 -    const unsigned rnd = 33u << (S - 1);
 +    const unsigned rnd = (32<<((S)-1)) + (1<<(S-7));
      int i;
  
      for (i = 0; i < width; i++) {
          int px = input_pixel(i) >> shp;
-         int b = (px & maskb) >> shb;
-         int g = (px & maskg) >> shg;
-         int r = (px & maskr) >> shr;
+         int b  = (px & maskb) >> shb;
+         int g  = (px & maskg) >> shg;
+         int r  = (px & maskr) >> shr;
  
 -        dst[i] = (ry * r + gy * g + by * b + rnd) >> S;
 +        dst[i] = (ry * r + gy * g + by * b + rnd) >> ((S)-6);
      }
  }
  
- static av_always_inline void
- rgb16_32ToUV_c_template(int16_t *dstU, int16_t *dstV,
-                         const uint8_t *src, int width,
-                         enum PixelFormat origin,
-                         int shr,   int shg,   int shb, int shp,
-                         int maskr, int maskg, int maskb,
-                         int rsh,   int gsh,   int bsh, int S)
- {
-     const int ru = RU << rsh, gu = GU << gsh, bu = BU << bsh,
-               rv = RV << rsh, gv = GV << gsh, bv = BV << bsh;
 -static av_always_inline void rgb16_32ToUV_c_template(uint8_t *dstU,
 -                                                     uint8_t *dstV,
++static av_always_inline void rgb16_32ToUV_c_template(int16_t *dstU,
++                                                     int16_t *dstV,
+                                                      const uint8_t *src,
+                                                      int width,
+                                                      enum PixelFormat origin,
+                                                      int shr, int shg,
+                                                      int shb, int shp,
+                                                      int maskr, int maskg,
+                                                      int maskb, int rsh,
+                                                      int gsh, int bsh, int S)
+ {
+     const int ru       = RU << rsh, gu = GU << gsh, bu = BU << bsh,
+               rv       = RV << rsh, gv = GV << gsh, bv = BV << bsh;
 -    const unsigned rnd = 257u << (S - 1);
 +    const unsigned rnd = (256u<<((S)-1)) + (1<<(S-7));
      int i;
  
      for (i = 0; i < width; i++) {
          int px = input_pixel(i) >> shp;
-         int b = (px & maskb) >> shb;
-         int g = (px & maskg) >> shg;
-         int r = (px & maskr) >> shr;
+         int b  = (px & maskb)   >> shb;
+         int g  = (px & maskg)   >> shg;
+         int r  = (px & maskr)   >> shr;
  
 -        dstU[i] = (ru * r + gu * g + bu * b + rnd) >> S;
 -        dstV[i] = (rv * r + gv * g + bv * b + rnd) >> S;
 +        dstU[i] = (ru * r + gu * g + bu * b + rnd) >> ((S)-6);
 +        dstV[i] = (rv * r + gv * g + bv * b + rnd) >> ((S)-6);
      }
  }
  
- static av_always_inline void
- rgb16_32ToUV_half_c_template(int16_t *dstU, int16_t *dstV,
-                              const uint8_t *src, int width,
-                              enum PixelFormat origin,
-                              int shr,   int shg,   int shb, int shp,
-                              int maskr, int maskg, int maskb,
-                              int rsh,   int gsh,   int bsh, int S)
- {
-     const int ru = RU << rsh, gu = GU << gsh, bu = BU << bsh,
-               rv = RV << rsh, gv = GV << gsh, bv = BV << bsh,
-               maskgx = ~(maskr | maskb);
 -static av_always_inline void rgb16_32ToUV_half_c_template(uint8_t *dstU,
 -                                                          uint8_t *dstV,
++static av_always_inline void rgb16_32ToUV_half_c_template(int16_t *dstU,
++                                                          int16_t *dstV,
+                                                           const uint8_t *src,
+                                                           int width,
+                                                           enum PixelFormat origin,
+                                                           int shr, int shg,
+                                                           int shb, int shp,
+                                                           int maskr, int maskg,
+                                                           int maskb, int rsh,
+                                                           int gsh, int bsh, int S)
+ {
+     const int ru       = RU << rsh, gu = GU << gsh, bu = BU << bsh,
+               rv       = RV << rsh, gv = GV << gsh, bv = BV << bsh,
+               maskgx   = ~(maskr | maskb);
 -    const unsigned rnd = 257u << S;
 +    const unsigned rnd = (256U<<(S)) + (1<<(S-6));
      int i;
  
-     maskr |= maskr << 1; maskb |= maskb << 1; maskg |= maskg << 1;
+     maskr |= maskr << 1;
+     maskb |= maskb << 1;
+     maskg |= maskg << 1;
      for (i = 0; i < width; i++) {
          int px0 = input_pixel(2 * i + 0) >> shp;
          int px1 = input_pixel(2 * i + 1) >> shp;
  
  #undef input_pixel
  
- #define rgb16_32_wrapper(fmt, name, shr, shg, shb, shp, maskr, \
-                          maskg, maskb, rsh, gsh, bsh, S) \
- static void name ## ToY_c(uint8_t *dst, const uint8_t *src, const uint8_t *unused1, const uint8_t *unused2, \
-                           int width, uint32_t *unused) \
- { \
-     rgb16_32ToY_c_template((int16_t*)dst, src, width, fmt, \
-                            shr, shg, shb, shp, \
-                            maskr, maskg, maskb, rsh, gsh, bsh, S); \
- } \
-  \
- static void name ## ToUV_c(uint8_t *dstU, uint8_t *dstV, \
-                            const uint8_t *unused0, const uint8_t *src, const uint8_t *dummy, \
-                            int width, uint32_t *unused) \
- { \
-     rgb16_32ToUV_c_template((int16_t*)dstU, (int16_t*)dstV, src, width, fmt,  \
-                             shr, shg, shb, shp, \
-                             maskr, maskg, maskb, rsh, gsh, bsh, S); \
- } \
-  \
- static void name ## ToUV_half_c(uint8_t *dstU, uint8_t *dstV, \
-                                 const uint8_t *unused0, const uint8_t *src, const uint8_t *dummy, \
-                                 int width, uint32_t *unused) \
- { \
-     rgb16_32ToUV_half_c_template((int16_t*)dstU, (int16_t*)dstV, src, width, fmt, \
-                                  shr, shg, shb, shp, \
-                                  maskr, maskg, maskb, rsh, gsh, bsh, S); \
- }
- rgb16_32_wrapper(PIX_FMT_BGR32,    bgr32,  16, 0,  0, 0, 0xFF0000, 0xFF00,   0x00FF,  8, 0,  8, RGB2YUV_SHIFT+8)
- rgb16_32_wrapper(PIX_FMT_BGR32_1,  bgr321, 16, 0,  0, 8, 0xFF0000, 0xFF00,   0x00FF,  8, 0,  8, RGB2YUV_SHIFT+8)
- rgb16_32_wrapper(PIX_FMT_RGB32,    rgb32,   0, 0, 16, 0,   0x00FF, 0xFF00, 0xFF0000,  8, 0,  8, RGB2YUV_SHIFT+8)
- rgb16_32_wrapper(PIX_FMT_RGB32_1,  rgb321,  0, 0, 16, 8,   0x00FF, 0xFF00, 0xFF0000,  8, 0,  8, RGB2YUV_SHIFT+8)
- rgb16_32_wrapper(PIX_FMT_BGR565LE, bgr16le, 0, 0,  0, 0,   0x001F, 0x07E0,   0xF800, 11, 5,  0, RGB2YUV_SHIFT+8)
- rgb16_32_wrapper(PIX_FMT_BGR555LE, bgr15le, 0, 0,  0, 0,   0x001F, 0x03E0,   0x7C00, 10, 5,  0, RGB2YUV_SHIFT+7)
- rgb16_32_wrapper(PIX_FMT_BGR444LE, bgr12le, 0, 0,  0, 0,   0x000F, 0x00F0,   0x0F00,  8, 4,  0, RGB2YUV_SHIFT+4)
- rgb16_32_wrapper(PIX_FMT_RGB565LE, rgb16le, 0, 0,  0, 0,   0xF800, 0x07E0,   0x001F,  0, 5, 11, RGB2YUV_SHIFT+8)
- rgb16_32_wrapper(PIX_FMT_RGB555LE, rgb15le, 0, 0,  0, 0,   0x7C00, 0x03E0,   0x001F,  0, 5, 10, RGB2YUV_SHIFT+7)
- rgb16_32_wrapper(PIX_FMT_RGB444LE, rgb12le, 0, 0,  0, 0,   0x0F00, 0x00F0,   0x000F,  0, 4,  8, RGB2YUV_SHIFT+4)
- rgb16_32_wrapper(PIX_FMT_BGR565BE, bgr16be, 0, 0,  0, 0,   0x001F, 0x07E0,   0xF800, 11, 5,  0, RGB2YUV_SHIFT+8)
- rgb16_32_wrapper(PIX_FMT_BGR555BE, bgr15be, 0, 0,  0, 0,   0x001F, 0x03E0,   0x7C00, 10, 5,  0, RGB2YUV_SHIFT+7)
- rgb16_32_wrapper(PIX_FMT_BGR444BE, bgr12be, 0, 0,  0, 0,   0x000F, 0x00F0,   0x0F00,  8, 4,  0, RGB2YUV_SHIFT+4)
- rgb16_32_wrapper(PIX_FMT_RGB565BE, rgb16be, 0, 0,  0, 0,   0xF800, 0x07E0,   0x001F,  0, 5, 11, RGB2YUV_SHIFT+8)
- rgb16_32_wrapper(PIX_FMT_RGB555BE, rgb15be, 0, 0,  0, 0,   0x7C00, 0x03E0,   0x001F,  0, 5, 10, RGB2YUV_SHIFT+7)
- rgb16_32_wrapper(PIX_FMT_RGB444BE, rgb12be, 0, 0,  0, 0,   0x0F00, 0x00F0,   0x000F,  0, 4,  8, RGB2YUV_SHIFT+4)
+ #define rgb16_32_wrapper(fmt, name, shr, shg, shb, shp, maskr,          \
+                          maskg, maskb, rsh, gsh, bsh, S)                \
 -static void name ## ToY_c(uint8_t *dst, const uint8_t *src,             \
++static void name ## ToY_c(uint8_t *dst, const uint8_t *src, const uint8_t *unused1, const uint8_t *unused2,            \
+                           int width, uint32_t *unused)                  \
+ {                                                                       \
 -    rgb16_32ToY_c_template(dst, src, width, fmt, shr, shg, shb, shp,    \
++    rgb16_32ToY_c_template((int16_t*)dst, src, width, fmt, shr, shg, shb, shp,    \
+                            maskr, maskg, maskb, rsh, gsh, bsh, S);      \
+ }                                                                       \
+                                                                         \
+ static void name ## ToUV_c(uint8_t *dstU, uint8_t *dstV,                \
 -                           const uint8_t *src, const uint8_t *dummy,    \
++                           const uint8_t *unused0, const uint8_t *src, const uint8_t *dummy,    \
+                            int width, uint32_t *unused)                 \
+ {                                                                       \
 -    rgb16_32ToUV_c_template(dstU, dstV, src, width, fmt,                \
++    rgb16_32ToUV_c_template((int16_t*)dstU, (int16_t*)dstV, src, width, fmt,                \
+                             shr, shg, shb, shp,                         \
+                             maskr, maskg, maskb, rsh, gsh, bsh, S);     \
+ }                                                                       \
+                                                                         \
+ static void name ## ToUV_half_c(uint8_t *dstU, uint8_t *dstV,           \
 -                                const uint8_t *src,                     \
++                                const uint8_t *unused0, const uint8_t *src,                     \
+                                 const uint8_t *dummy,                   \
+                                 int width, uint32_t *unused)            \
+ {                                                                       \
 -    rgb16_32ToUV_half_c_template(dstU, dstV, src, width, fmt,           \
++    rgb16_32ToUV_half_c_template((int16_t*)dstU, (int16_t*)dstV, src, width, fmt,           \
+                                  shr, shg, shb, shp,                    \
+                                  maskr, maskg, maskb,                   \
+                                  rsh, gsh, bsh, S);                     \
+ }
+ rgb16_32_wrapper(PIX_FMT_BGR32,    bgr32,  16, 0,  0, 0, 0xFF0000, 0xFF00,   0x00FF,  8, 0,  8, RGB2YUV_SHIFT + 8)
+ rgb16_32_wrapper(PIX_FMT_BGR32_1,  bgr321, 16, 0,  0, 8, 0xFF0000, 0xFF00,   0x00FF,  8, 0,  8, RGB2YUV_SHIFT + 8)
+ rgb16_32_wrapper(PIX_FMT_RGB32,    rgb32,   0, 0, 16, 0,   0x00FF, 0xFF00, 0xFF0000,  8, 0,  8, RGB2YUV_SHIFT + 8)
+ rgb16_32_wrapper(PIX_FMT_RGB32_1,  rgb321,  0, 0, 16, 8,   0x00FF, 0xFF00, 0xFF0000,  8, 0,  8, RGB2YUV_SHIFT + 8)
+ rgb16_32_wrapper(PIX_FMT_BGR565LE, bgr16le, 0, 0,  0, 0,   0x001F, 0x07E0,   0xF800, 11, 5,  0, RGB2YUV_SHIFT + 8)
+ rgb16_32_wrapper(PIX_FMT_BGR555LE, bgr15le, 0, 0,  0, 0,   0x001F, 0x03E0,   0x7C00, 10, 5,  0, RGB2YUV_SHIFT + 7)
+ rgb16_32_wrapper(PIX_FMT_BGR444LE, bgr12le, 0, 0,  0, 0,   0x000F, 0x00F0,   0x0F00,  8, 4,  0, RGB2YUV_SHIFT + 4)
+ rgb16_32_wrapper(PIX_FMT_RGB565LE, rgb16le, 0, 0,  0, 0,   0xF800, 0x07E0,   0x001F,  0, 5, 11, RGB2YUV_SHIFT + 8)
+ rgb16_32_wrapper(PIX_FMT_RGB555LE, rgb15le, 0, 0,  0, 0,   0x7C00, 0x03E0,   0x001F,  0, 5, 10, RGB2YUV_SHIFT + 7)
+ rgb16_32_wrapper(PIX_FMT_RGB444LE, rgb12le, 0, 0,  0, 0,   0x0F00, 0x00F0,   0x000F,  0, 4,  8, RGB2YUV_SHIFT + 4)
+ rgb16_32_wrapper(PIX_FMT_BGR565BE, bgr16be, 0, 0,  0, 0,   0x001F, 0x07E0,   0xF800, 11, 5,  0, RGB2YUV_SHIFT + 8)
+ rgb16_32_wrapper(PIX_FMT_BGR555BE, bgr15be, 0, 0,  0, 0,   0x001F, 0x03E0,   0x7C00, 10, 5,  0, RGB2YUV_SHIFT + 7)
+ rgb16_32_wrapper(PIX_FMT_BGR444BE, bgr12be, 0, 0,  0, 0,   0x000F, 0x00F0,   0x0F00,  8, 4,  0, RGB2YUV_SHIFT + 4)
+ rgb16_32_wrapper(PIX_FMT_RGB565BE, rgb16be, 0, 0,  0, 0,   0xF800, 0x07E0,   0x001F,  0, 5, 11, RGB2YUV_SHIFT + 8)
+ rgb16_32_wrapper(PIX_FMT_RGB555BE, rgb15be, 0, 0,  0, 0,   0x7C00, 0x03E0,   0x001F,  0, 5, 10, RGB2YUV_SHIFT + 7)
+ rgb16_32_wrapper(PIX_FMT_RGB444BE, rgb12be, 0, 0,  0, 0,   0x0F00, 0x00F0,   0x000F,  0, 4,  8, RGB2YUV_SHIFT + 4)
  
 -static void abgrToA_c(uint8_t *dst, const uint8_t *src, int width,
 -                      uint32_t *unused)
 +static void gbr24pToUV_half_c(uint16_t *dstU, uint16_t *dstV,
 +                         const uint8_t *gsrc, const uint8_t *bsrc, const uint8_t *rsrc,
 +                         int width, enum PixelFormat origin)
  {
      int i;
-     for (i=0; i<width; i++) {
 -    for (i = 0; i < width; i++)
 -        dst[i] = src[4 * i];
++    for (i = 0; i < width; i++) {
 +        unsigned int g   = gsrc[2*i] + gsrc[2*i+1];
 +        unsigned int b   = bsrc[2*i] + bsrc[2*i+1];
 +        unsigned int r   = rsrc[2*i] + rsrc[2*i+1];
 +
 +        dstU[i] = (RU*r + GU*g + BU*b + (0x4001<<(RGB2YUV_SHIFT-6))) >> (RGB2YUV_SHIFT-6+1);
 +        dstV[i] = (RV*r + GV*g + BV*b + (0x4001<<(RGB2YUV_SHIFT-6))) >> (RGB2YUV_SHIFT-6+1);
 +    }
  }
  
 -static void rgbaToA_c(uint8_t *dst, const uint8_t *src, int width,
 -                      uint32_t *unused)
 +static void rgba64ToA_c(int16_t *dst, const uint16_t *src, const uint8_t *unused1,
 +                        const uint8_t *unused2, int width, uint32_t *unused)
  {
      int i;
-     for (i=0; i<width; i++) {
-         dst[i]= src[4*i+3];
-     }
+     for (i = 0; i < width; i++)
+         dst[i] = src[4 * i + 3];
  }
  
 -static void palToY_c(uint8_t *dst, const uint8_t *src, int width, uint32_t *pal)
 +static void abgrToA_c(int16_t *dst, const uint8_t *src, const uint8_t *unused1, const uint8_t *unused2, int width, uint32_t *unused)
 +{
 +    int i;
 +    for (i=0; i<width; i++) {
 +        dst[i]= src[4*i]<<6;
 +    }
 +}
 +
 +static void rgbaToA_c(int16_t *dst, const uint8_t *src, const uint8_t *unused1, const uint8_t *unused2, int width, uint32_t *unused)
 +{
 +    int i;
 +    for (i=0; i<width; i++) {
 +        dst[i]= src[4*i+3]<<6;
 +    }
 +}
 +
 +static void palToA_c(int16_t *dst, const uint8_t *src, const uint8_t *unused1, const uint8_t *unused2, int width, uint32_t *pal)
 +{
 +    int i;
 +    for (i=0; i<width; i++) {
 +        int d= src[i];
 +
 +        dst[i]= (pal[d] >> 24)<<6;
 +    }
 +}
 +
 +static void palToY_c(int16_t *dst, const uint8_t *src, const uint8_t *unused1, const uint8_t *unused2, long width, uint32_t *pal)
  {
      int i;
-     for (i=0; i<width; i++) {
-         int d= src[i];
+     for (i = 0; i < width; i++) {
+         int d = src[i];
  
-         dst[i]= (pal[d] & 0xFF)<<6;
 -        dst[i] = pal[d] & 0xFF;
++        dst[i] = (pal[d] & 0xFF)<<6;
      }
  }
  
@@@ -414,11 -334,11 +450,11 @@@ static void palToUV_c(uint16_t *dstU, i
  {
      int i;
      assert(src1 == src2);
-     for (i=0; i<width; i++) {
-         int p= pal[src1[i]];
+     for (i = 0; i < width; i++) {
+         int p = pal[src1[i]];
  
-         dstU[i]= (uint8_t)(p>> 8)<<6;
-         dstV[i]= (uint8_t)(p>>16)<<6;
 -        dstU[i] = p >> 8;
 -        dstV[i] = p >> 16;
++        dstU[i] = (uint8_t)(p>> 8)<<6;
++        dstV[i] = (uint8_t)(p>>16)<<6;
      }
  }
  
@@@ -427,14 -348,9 +463,14 @@@ static void monowhite2Y_c(int16_t *dst
      int i, j;
      width = (width + 7) >> 3;
      for (i = 0; i < width; i++) {
-         int d= ~src[i];
-         for(j=0; j<8; j++)
-             dst[8*i+j]= ((d>>(7-j))&1)*16383;
+         int d = ~src[i];
+         for (j = 0; j < 8; j++)
 -            dst[8 * i + j] = ((d >> (7 - j)) & 1) * 255;
++            dst[8*i+j]= ((d>>(7-j))&1) * 16383;
 +    }
 +    if(width&7){
 +        int d= ~src[i];
-         for(j=0; j<(width&7); j++)
-             dst[8*i+j]= ((d>>(7-j))&1)*16383;
++        for (j = 0; j < (width&7); j++)
++            dst[8*i+j]= ((d>>(7-j))&1) * 16383;
      }
  }
  
@@@ -443,14 -360,9 +479,14 @@@ static void monoblack2Y_c(int16_t *dst
      int i, j;
      width = (width + 7) >> 3;
      for (i = 0; i < width; i++) {
-         int d= src[i];
-         for(j=0; j<8; j++)
-             dst[8*i+j]= ((d>>(7-j))&1)*16383;
+         int d = src[i];
+         for (j = 0; j < 8; j++)
 -            dst[8 * i + j] = ((d >> (7 - j)) & 1) * 255;
++            dst[8*i+j]= ((d>>(7-j))&1) * 16383;
 +    }
 +    if(width&7){
-         int d= src[i];
-         for(j=0; j<(width&7); j++)
-             dst[8*i+j]= ((d>>(7-j))&1)*16383;
++        int d = src[i];
++        for (j = 0; j < (width&7); j++)
++            dst[8*i+j] = ((d>>(7-j))&1) * 16383;
      }
  }
  
@@@ -458,11 -370,11 +494,11 @@@ static void yuy2ToY_c(uint8_t *dst, con
                        uint32_t *unused)
  {
      int i;
-     for (i=0; i<width; i++)
-         dst[i]= src[2*i];
+     for (i = 0; i < width; i++)
+         dst[i] = src[2 * i];
  }
  
 -static void yuy2ToUV_c(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1,
 +static void yuy2ToUV_c(uint8_t *dstU, uint8_t *dstV, const uint8_t *unused0, const uint8_t *src1,
                         const uint8_t *src2, int width, uint32_t *unused)
  {
      int i;
      assert(src1 == src2);
  }
  
- static void bswap16Y_c(uint8_t *_dst, const uint8_t *_src, const uint8_t *unused1, const uint8_t *unused2,  int width, uint32_t *unused)
 -static void bswap16Y_c(uint8_t *_dst, const uint8_t *_src, int width,
++static void bswap16Y_c(uint8_t *_dst, const uint8_t *_src, const uint8_t *unused1, const uint8_t *unused2,  int width,
+                        uint32_t *unused)
  {
      int i;
-     const uint16_t *src = (const uint16_t *) _src;
-     uint16_t *dst = (uint16_t *) _dst;
-     for (i=0; i<width; i++) {
+     const uint16_t *src = (const uint16_t *)_src;
+     uint16_t *dst       = (uint16_t *)_dst;
+     for (i = 0; i < width; i++)
          dst[i] = av_bswap16(src[i]);
-     }
  }
  
 -static void bswap16UV_c(uint8_t *_dstU, uint8_t *_dstV, const uint8_t *_src1,
 +static void bswap16UV_c(uint8_t *_dstU, uint8_t *_dstV, const uint8_t *unused0, const uint8_t *_src1,
                          const uint8_t *_src2, int width, uint32_t *unused)
  {
      int i;
  }
  
  /* This is almost identical to the previous, end exists only because
-  * yuy2ToY/UV)(dst, src+1, ...) would have 100% unaligned accesses. */
+  * yuy2ToY/UV)(dst, src + 1, ...) would have 100% unaligned accesses. */
 -static void uyvyToY_c(uint8_t *dst, const uint8_t *src, int width,
 +static void uyvyToY_c(uint8_t *dst, const uint8_t *src, const uint8_t *unused1, const uint8_t *unused2,  int width,
                        uint32_t *unused)
  {
      int i;
-     for (i=0; i<width; i++)
-         dst[i]= src[2*i+1];
+     for (i = 0; i < width; i++)
+         dst[i] = src[2 * i + 1];
  }
  
 -static void uyvyToUV_c(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1,
 +static void uyvyToUV_c(uint8_t *dstU, uint8_t *dstV, const uint8_t *unused0, const uint8_t *src1,
                         const uint8_t *src2, int width, uint32_t *unused)
  {
      int i;
@@@ -547,12 -459,12 +583,12 @@@ static void bgr24ToY_c(int16_t *dst, co
                         int width, uint32_t *unused)
  {
      int i;
-     for (i=0; i<width; i++) {
-         int b= src[i*3+0];
-         int g= src[i*3+1];
-         int r= src[i*3+2];
+     for (i = 0; i < width; i++) {
+         int b = src[i * 3 + 0];
+         int g = src[i * 3 + 1];
+         int r = src[i * 3 + 2];
  
-         dst[i]= ((RY*r + GY*g + BY*b + (32<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6));
 -        dst[i] = ((RY * r + GY * g + BY * b + (33 << (RGB2YUV_SHIFT - 1))) >> RGB2YUV_SHIFT);
++        dst[i] = ((RY*r + GY*g + BY*b + (32<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6));
      }
  }
  
@@@ -560,13 -472,13 +596,13 @@@ static void bgr24ToUV_c(int16_t *dstU, 
                          const uint8_t *src2, int width, uint32_t *unused)
  {
      int i;
-     for (i=0; i<width; i++) {
-         int b= src1[3*i + 0];
-         int g= src1[3*i + 1];
-         int r= src1[3*i + 2];
+     for (i = 0; i < width; i++) {
+         int b = src1[3 * i + 0];
+         int g = src1[3 * i + 1];
+         int r = src1[3 * i + 2];
  
-         dstU[i]= (RU*r + GU*g + BU*b + (256<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6);
-         dstV[i]= (RV*r + GV*g + BV*b + (256<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6);
 -        dstU[i] = (RU * r + GU * g + BU * b + (257 << (RGB2YUV_SHIFT - 1))) >> RGB2YUV_SHIFT;
 -        dstV[i] = (RV * r + GV * g + BV * b + (257 << (RGB2YUV_SHIFT - 1))) >> RGB2YUV_SHIFT;
++        dstU[i] = (RU*r + GU*g + BU*b + (256<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6);
++        dstV[i] = (RV*r + GV*g + BV*b + (256<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6);
      }
      assert(src1 == src2);
  }
@@@ -575,13 -487,13 +611,13 @@@ static void bgr24ToUV_half_c(int16_t *d
                               const uint8_t *src2, int width, uint32_t *unused)
  {
      int i;
-     for (i=0; i<width; i++) {
-         int b= src1[6*i + 0] + src1[6*i + 3];
-         int g= src1[6*i + 1] + src1[6*i + 4];
-         int r= src1[6*i + 2] + src1[6*i + 5];
+     for (i = 0; i < width; i++) {
+         int b = src1[6 * i + 0] + src1[6 * i + 3];
+         int g = src1[6 * i + 1] + src1[6 * i + 4];
+         int r = src1[6 * i + 2] + src1[6 * i + 5];
  
-         dstU[i]= (RU*r + GU*g + BU*b + (256<<RGB2YUV_SHIFT) + (1<<(RGB2YUV_SHIFT-6)))>>(RGB2YUV_SHIFT-5);
-         dstV[i]= (RV*r + GV*g + BV*b + (256<<RGB2YUV_SHIFT) + (1<<(RGB2YUV_SHIFT-6)))>>(RGB2YUV_SHIFT-5);
 -        dstU[i] = (RU * r + GU * g + BU * b + (257 << RGB2YUV_SHIFT)) >> (RGB2YUV_SHIFT + 1);
 -        dstV[i] = (RV * r + GV * g + BV * b + (257 << RGB2YUV_SHIFT)) >> (RGB2YUV_SHIFT + 1);
++        dstU[i] = (RU*r + GU*g + BU*b + (256<<RGB2YUV_SHIFT) + (1<<(RGB2YUV_SHIFT-6)))>>(RGB2YUV_SHIFT-5);
++        dstV[i] = (RV*r + GV*g + BV*b + (256<<RGB2YUV_SHIFT) + (1<<(RGB2YUV_SHIFT-6)))>>(RGB2YUV_SHIFT-5);
      }
      assert(src1 == src2);
  }
@@@ -590,12 -502,12 +626,12 @@@ static void rgb24ToY_c(int16_t *dst, co
                         uint32_t *unused)
  {
      int i;
-     for (i=0; i<width; i++) {
-         int r= src[i*3+0];
-         int g= src[i*3+1];
-         int b= src[i*3+2];
+     for (i = 0; i < width; i++) {
+         int r = src[i * 3 + 0];
+         int g = src[i * 3 + 1];
+         int b = src[i * 3 + 2];
  
-         dst[i]= ((RY*r + GY*g + BY*b + (32<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6));
 -        dst[i] = ((RY * r + GY * g + BY * b + (33 << (RGB2YUV_SHIFT - 1))) >> RGB2YUV_SHIFT);
++        dst[i] = ((RY*r + GY*g + BY*b + (32<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6));
      }
  }
  
@@@ -603,14 -515,14 +639,14 @@@ static void rgb24ToUV_c(int16_t *dstU, 
                          const uint8_t *src2, int width, uint32_t *unused)
  {
      int i;
-     assert(src1==src2);
-     for (i=0; i<width; i++) {
-         int r= src1[3*i + 0];
-         int g= src1[3*i + 1];
-         int b= src1[3*i + 2];
+     assert(src1 == src2);
+     for (i = 0; i < width; i++) {
+         int r = src1[3 * i + 0];
+         int g = src1[3 * i + 1];
+         int b = src1[3 * i + 2];
  
-         dstU[i]= (RU*r + GU*g + BU*b + (256<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6);
-         dstV[i]= (RV*r + GV*g + BV*b + (256<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6);
 -        dstU[i] = (RU * r + GU * g + BU * b + (257 << (RGB2YUV_SHIFT - 1))) >> RGB2YUV_SHIFT;
 -        dstV[i] = (RV * r + GV * g + BV * b + (257 << (RGB2YUV_SHIFT - 1))) >> RGB2YUV_SHIFT;
++        dstU[i] = (RU*r + GU*g + BU*b + (256<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6);
++        dstV[i] = (RV*r + GV*g + BV*b + (256<<(RGB2YUV_SHIFT-1)) + (1<<(RGB2YUV_SHIFT-7)))>>(RGB2YUV_SHIFT-6);
      }
  }
  
@@@ -618,14 -530,14 +654,14 @@@ static void rgb24ToUV_half_c(int16_t *d
                               const uint8_t *src2, int width, uint32_t *unused)
  {
      int i;
-     assert(src1==src2);
-     for (i=0; i<width; i++) {
-         int r= src1[6*i + 0] + src1[6*i + 3];
-         int g= src1[6*i + 1] + src1[6*i + 4];
-         int b= src1[6*i + 2] + src1[6*i + 5];
+     assert(src1 == src2);
+     for (i = 0; i < width; i++) {
+         int r = src1[6 * i + 0] + src1[6 * i + 3];
+         int g = src1[6 * i + 1] + src1[6 * i + 4];
+         int b = src1[6 * i + 2] + src1[6 * i + 5];
  
-         dstU[i]= (RU*r + GU*g + BU*b + (256<<RGB2YUV_SHIFT) + (1<<(RGB2YUV_SHIFT-6)))>>(RGB2YUV_SHIFT-5);
-         dstV[i]= (RV*r + GV*g + BV*b + (256<<RGB2YUV_SHIFT) + (1<<(RGB2YUV_SHIFT-6)))>>(RGB2YUV_SHIFT-5);
 -        dstU[i] = (RU * r + GU * g + BU * b + (257 << RGB2YUV_SHIFT)) >> (RGB2YUV_SHIFT + 1);
 -        dstV[i] = (RV * r + GV * g + BV * b + (257 << RGB2YUV_SHIFT)) >> (RGB2YUV_SHIFT + 1);
++        dstU[i] = (RU*r + GU*g + BU*b + (256<<RGB2YUV_SHIFT) + (1<<(RGB2YUV_SHIFT-6)))>>(RGB2YUV_SHIFT-5);
++        dstV[i] = (RV*r + GV*g + BV*b + (256<<RGB2YUV_SHIFT) + (1<<(RGB2YUV_SHIFT-6)))>>(RGB2YUV_SHIFT-5);
      }
  }
  
@@@ -759,59 -693,142 +817,157 @@@ av_cold void ff_sws_init_input_funcs(Sw
  #endif
      }
      if (c->chrSrcHSubSample) {
-         switch(srcFormat) {
-         case PIX_FMT_RGBA64BE: c->chrToYV12 = rgb64BEToUV_half_c; break;
-         case PIX_FMT_RGBA64LE: c->chrToYV12 = rgb64LEToUV_half_c; break;
-         case PIX_FMT_RGB48BE : c->chrToYV12 = rgb48BEToUV_half_c; break;
-         case PIX_FMT_RGB48LE : c->chrToYV12 = rgb48LEToUV_half_c; break;
-         case PIX_FMT_BGR48BE : c->chrToYV12 = bgr48BEToUV_half_c; break;
-         case PIX_FMT_BGR48LE : c->chrToYV12 = bgr48LEToUV_half_c; break;
-         case PIX_FMT_RGB32   : c->chrToYV12 = bgr32ToUV_half_c;   break;
-         case PIX_FMT_RGB32_1 : c->chrToYV12 = bgr321ToUV_half_c;  break;
-         case PIX_FMT_BGR24   : c->chrToYV12 = bgr24ToUV_half_c;   break;
-         case PIX_FMT_BGR565LE: c->chrToYV12 = bgr16leToUV_half_c; break;
-         case PIX_FMT_BGR565BE: c->chrToYV12 = bgr16beToUV_half_c; break;
-         case PIX_FMT_BGR555LE: c->chrToYV12 = bgr15leToUV_half_c; break;
-         case PIX_FMT_BGR555BE: c->chrToYV12 = bgr15beToUV_half_c; break;
-         case PIX_FMT_BGR444LE: c->chrToYV12 = bgr12leToUV_half_c; break;
-         case PIX_FMT_BGR444BE: c->chrToYV12 = bgr12beToUV_half_c; break;
-         case PIX_FMT_BGR32   : c->chrToYV12 = rgb32ToUV_half_c;   break;
-         case PIX_FMT_BGR32_1 : c->chrToYV12 = rgb321ToUV_half_c;  break;
-         case PIX_FMT_RGB24   : c->chrToYV12 = rgb24ToUV_half_c;   break;
-         case PIX_FMT_RGB565LE: c->chrToYV12 = rgb16leToUV_half_c; break;
-         case PIX_FMT_RGB565BE: c->chrToYV12 = rgb16beToUV_half_c; break;
-         case PIX_FMT_RGB555LE: c->chrToYV12 = rgb15leToUV_half_c; break;
-         case PIX_FMT_RGB555BE: c->chrToYV12 = rgb15beToUV_half_c; break;
-         case PIX_FMT_GBR24P  : c->chrToYV12 = gbr24pToUV_half_c;  break;
-         case PIX_FMT_RGB444LE: c->chrToYV12 = rgb12leToUV_half_c; break;
-         case PIX_FMT_RGB444BE: c->chrToYV12 = rgb12beToUV_half_c; break;
+         switch (srcFormat) {
++        case PIX_FMT_RGBA64BE:
++            c->chrToYV12 = rgb64BEToUV_half_c;
++            break;
++        case PIX_FMT_RGBA64LE:
++            c->chrToYV12 = rgb64LEToUV_half_c;
++            break;
+         case PIX_FMT_RGB48BE:
+             c->chrToYV12 = rgb48BEToUV_half_c;
+             break;
+         case PIX_FMT_RGB48LE:
+             c->chrToYV12 = rgb48LEToUV_half_c;
+             break;
+         case PIX_FMT_BGR48BE:
+             c->chrToYV12 = bgr48BEToUV_half_c;
+             break;
+         case PIX_FMT_BGR48LE:
+             c->chrToYV12 = bgr48LEToUV_half_c;
+             break;
+         case PIX_FMT_RGB32:
+             c->chrToYV12 = bgr32ToUV_half_c;
+             break;
+         case PIX_FMT_RGB32_1:
+             c->chrToYV12 = bgr321ToUV_half_c;
+             break;
+         case PIX_FMT_BGR24:
+             c->chrToYV12 = bgr24ToUV_half_c;
+             break;
+         case PIX_FMT_BGR565LE:
+             c->chrToYV12 = bgr16leToUV_half_c;
+             break;
+         case PIX_FMT_BGR565BE:
+             c->chrToYV12 = bgr16beToUV_half_c;
+             break;
+         case PIX_FMT_BGR555LE:
+             c->chrToYV12 = bgr15leToUV_half_c;
+             break;
+         case PIX_FMT_BGR555BE:
+             c->chrToYV12 = bgr15beToUV_half_c;
+             break;
++        case PIX_FMT_GBR24P  :
++            c->chrToYV12 = gbr24pToUV_half_c;
++            break;
+         case PIX_FMT_BGR444LE:
+             c->chrToYV12 = bgr12leToUV_half_c;
+             break;
+         case PIX_FMT_BGR444BE:
+             c->chrToYV12 = bgr12beToUV_half_c;
+             break;
+         case PIX_FMT_BGR32:
+             c->chrToYV12 = rgb32ToUV_half_c;
+             break;
+         case PIX_FMT_BGR32_1:
+             c->chrToYV12 = rgb321ToUV_half_c;
+             break;
+         case PIX_FMT_RGB24:
+             c->chrToYV12 = rgb24ToUV_half_c;
+             break;
+         case PIX_FMT_RGB565LE:
+             c->chrToYV12 = rgb16leToUV_half_c;
+             break;
+         case PIX_FMT_RGB565BE:
+             c->chrToYV12 = rgb16beToUV_half_c;
+             break;
+         case PIX_FMT_RGB555LE:
+             c->chrToYV12 = rgb15leToUV_half_c;
+             break;
+         case PIX_FMT_RGB555BE:
+             c->chrToYV12 = rgb15beToUV_half_c;
+             break;
+         case PIX_FMT_RGB444LE:
+             c->chrToYV12 = rgb12leToUV_half_c;
+             break;
+         case PIX_FMT_RGB444BE:
+             c->chrToYV12 = rgb12beToUV_half_c;
+             break;
          }
      } else {
-         switch(srcFormat) {
-         case PIX_FMT_RGBA64BE: c->chrToYV12 = rgb64BEToUV_c; break;
-         case PIX_FMT_RGBA64LE: c->chrToYV12 = rgb64LEToUV_c; break;
-         case PIX_FMT_RGB48BE : c->chrToYV12 = rgb48BEToUV_c; break;
-         case PIX_FMT_RGB48LE : c->chrToYV12 = rgb48LEToUV_c; break;
-         case PIX_FMT_BGR48BE : c->chrToYV12 = bgr48BEToUV_c; break;
-         case PIX_FMT_BGR48LE : c->chrToYV12 = bgr48LEToUV_c; break;
-         case PIX_FMT_RGB32   : c->chrToYV12 = bgr32ToUV_c;   break;
-         case PIX_FMT_RGB32_1 : c->chrToYV12 = bgr321ToUV_c;  break;
-         case PIX_FMT_BGR24   : c->chrToYV12 = bgr24ToUV_c;   break;
-         case PIX_FMT_BGR565LE: c->chrToYV12 = bgr16leToUV_c; break;
-         case PIX_FMT_BGR565BE: c->chrToYV12 = bgr16beToUV_c; break;
-         case PIX_FMT_BGR555LE: c->chrToYV12 = bgr15leToUV_c; break;
-         case PIX_FMT_BGR555BE: c->chrToYV12 = bgr15beToUV_c; break;
-         case PIX_FMT_BGR444LE: c->chrToYV12 = bgr12leToUV_c; break;
-         case PIX_FMT_BGR444BE: c->chrToYV12 = bgr12beToUV_c; break;
-         case PIX_FMT_BGR32   : c->chrToYV12 = rgb32ToUV_c;   break;
-         case PIX_FMT_BGR32_1 : c->chrToYV12 = rgb321ToUV_c;  break;
-         case PIX_FMT_RGB24   : c->chrToYV12 = rgb24ToUV_c;   break;
-         case PIX_FMT_RGB565LE: c->chrToYV12 = rgb16leToUV_c; break;
-         case PIX_FMT_RGB565BE: c->chrToYV12 = rgb16beToUV_c; break;
-         case PIX_FMT_RGB555LE: c->chrToYV12 = rgb15leToUV_c; break;
-         case PIX_FMT_RGB555BE: c->chrToYV12 = rgb15beToUV_c; break;
-         case PIX_FMT_RGB444LE: c->chrToYV12 = rgb12leToUV_c; break;
-         case PIX_FMT_RGB444BE: c->chrToYV12 = rgb12beToUV_c; break;
+         switch (srcFormat) {
++        case PIX_FMT_RGBA64BE:
++            c->chrToYV12 = rgb64BEToUV_c;
++            break;
++        case PIX_FMT_RGBA64LE:
++            c->chrToYV12 = rgb64LEToUV_c;
++            break;
+         case PIX_FMT_RGB48BE:
+             c->chrToYV12 = rgb48BEToUV_c;
+             break;
+         case PIX_FMT_RGB48LE:
+             c->chrToYV12 = rgb48LEToUV_c;
+             break;
+         case PIX_FMT_BGR48BE:
+             c->chrToYV12 = bgr48BEToUV_c;
+             break;
+         case PIX_FMT_BGR48LE:
+             c->chrToYV12 = bgr48LEToUV_c;
+             break;
+         case PIX_FMT_RGB32:
+             c->chrToYV12 = bgr32ToUV_c;
+             break;
+         case PIX_FMT_RGB32_1:
+             c->chrToYV12 = bgr321ToUV_c;
+             break;
+         case PIX_FMT_BGR24:
+             c->chrToYV12 = bgr24ToUV_c;
+             break;
+         case PIX_FMT_BGR565LE:
+             c->chrToYV12 = bgr16leToUV_c;
+             break;
+         case PIX_FMT_BGR565BE:
+             c->chrToYV12 = bgr16beToUV_c;
+             break;
+         case PIX_FMT_BGR555LE:
+             c->chrToYV12 = bgr15leToUV_c;
+             break;
+         case PIX_FMT_BGR555BE:
+             c->chrToYV12 = bgr15beToUV_c;
+             break;
+         case PIX_FMT_BGR444LE:
+             c->chrToYV12 = bgr12leToUV_c;
+             break;
+         case PIX_FMT_BGR444BE:
+             c->chrToYV12 = bgr12beToUV_c;
+             break;
+         case PIX_FMT_BGR32:
+             c->chrToYV12 = rgb32ToUV_c;
+             break;
+         case PIX_FMT_BGR32_1:
+             c->chrToYV12 = rgb321ToUV_c;
+             break;
+         case PIX_FMT_RGB24:
+             c->chrToYV12 = rgb24ToUV_c;
+             break;
+         case PIX_FMT_RGB565LE:
+             c->chrToYV12 = rgb16leToUV_c;
+             break;
+         case PIX_FMT_RGB565BE:
+             c->chrToYV12 = rgb16beToUV_c;
+             break;
+         case PIX_FMT_RGB555LE:
+             c->chrToYV12 = rgb15leToUV_c;
+             break;
+         case PIX_FMT_RGB555BE:
+             c->chrToYV12 = rgb15beToUV_c;
+             break;
+         case PIX_FMT_RGB444LE:
+             c->chrToYV12 = rgb12leToUV_c;
+             break;
+         case PIX_FMT_RGB444BE:
+             c->chrToYV12 = rgb12beToUV_c;
+             break;
          }
      }
  
      case PIX_FMT_YUV420P16BE:
      case PIX_FMT_YUV422P16BE:
      case PIX_FMT_YUV444P16BE:
-     case PIX_FMT_GRAY16BE: c->lumToYV12 = bswap16Y_c; break;
+     case PIX_FMT_GRAY16BE:
+         c->lumToYV12 = bswap16Y_c;
+         break;
  #endif
-     case PIX_FMT_YUYV422  :
-     case PIX_FMT_Y400A    : c->lumToYV12 = yuy2ToY_c; break;
-     case PIX_FMT_UYVY422  : c->lumToYV12 = uyvyToY_c;    break;
-     case PIX_FMT_BGR24    : c->lumToYV12 = bgr24ToY_c;   break;
-     case PIX_FMT_BGR565LE : c->lumToYV12 = bgr16leToY_c; break;
-     case PIX_FMT_BGR565BE : c->lumToYV12 = bgr16beToY_c; break;
-     case PIX_FMT_BGR555LE : c->lumToYV12 = bgr15leToY_c; break;
-     case PIX_FMT_BGR555BE : c->lumToYV12 = bgr15beToY_c; break;
-     case PIX_FMT_BGR444LE : c->lumToYV12 = bgr12leToY_c; break;
-     case PIX_FMT_BGR444BE : c->lumToYV12 = bgr12beToY_c; break;
-     case PIX_FMT_RGB24    : c->lumToYV12 = rgb24ToY_c;   break;
-     case PIX_FMT_RGB565LE : c->lumToYV12 = rgb16leToY_c; break;
-     case PIX_FMT_RGB565BE : c->lumToYV12 = rgb16beToY_c; break;
-     case PIX_FMT_RGB555LE : c->lumToYV12 = rgb15leToY_c; break;
-     case PIX_FMT_RGB555BE : c->lumToYV12 = rgb15beToY_c; break;
-     case PIX_FMT_RGB444LE : c->lumToYV12 = rgb12leToY_c; break;
-     case PIX_FMT_RGB444BE : c->lumToYV12 = rgb12beToY_c; break;
-     case PIX_FMT_RGB8     :
-     case PIX_FMT_BGR8     :
-     case PIX_FMT_PAL8     :
+     case PIX_FMT_YUYV422:
+     case PIX_FMT_Y400A:
+         c->lumToYV12 = yuy2ToY_c;
+         break;
+     case PIX_FMT_UYVY422:
+         c->lumToYV12 = uyvyToY_c;
+         break;
+     case PIX_FMT_BGR24:
+         c->lumToYV12 = bgr24ToY_c;
+         break;
+     case PIX_FMT_BGR565LE:
+         c->lumToYV12 = bgr16leToY_c;
+         break;
+     case PIX_FMT_BGR565BE:
+         c->lumToYV12 = bgr16beToY_c;
+         break;
+     case PIX_FMT_BGR555LE:
+         c->lumToYV12 = bgr15leToY_c;
+         break;
+     case PIX_FMT_BGR555BE:
+         c->lumToYV12 = bgr15beToY_c;
+         break;
+     case PIX_FMT_BGR444LE:
+         c->lumToYV12 = bgr12leToY_c;
+         break;
+     case PIX_FMT_BGR444BE:
+         c->lumToYV12 = bgr12beToY_c;
+         break;
+     case PIX_FMT_RGB24:
+         c->lumToYV12 = rgb24ToY_c;
+         break;
+     case PIX_FMT_RGB565LE:
+         c->lumToYV12 = rgb16leToY_c;
+         break;
+     case PIX_FMT_RGB565BE:
+         c->lumToYV12 = rgb16beToY_c;
+         break;
+     case PIX_FMT_RGB555LE:
+         c->lumToYV12 = rgb15leToY_c;
+         break;
+     case PIX_FMT_RGB555BE:
+         c->lumToYV12 = rgb15beToY_c;
+         break;
+     case PIX_FMT_RGB444LE:
+         c->lumToYV12 = rgb12leToY_c;
+         break;
+     case PIX_FMT_RGB444BE:
+         c->lumToYV12 = rgb12beToY_c;
+         break;
+     case PIX_FMT_RGB8:
+     case PIX_FMT_BGR8:
+     case PIX_FMT_PAL8:
      case PIX_FMT_BGR4_BYTE:
-     case PIX_FMT_RGB4_BYTE: c->lumToYV12 = palToY_c; break;
-     case PIX_FMT_MONOBLACK: c->lumToYV12 = monoblack2Y_c; break;
-     case PIX_FMT_MONOWHITE: c->lumToYV12 = monowhite2Y_c; break;
-     case PIX_FMT_RGB32  : c->lumToYV12 = bgr32ToY_c;  break;
-     case PIX_FMT_RGB32_1: c->lumToYV12 = bgr321ToY_c; break;
-     case PIX_FMT_BGR32  : c->lumToYV12 = rgb32ToY_c;  break;
-     case PIX_FMT_BGR32_1: c->lumToYV12 = rgb321ToY_c; break;
-     case PIX_FMT_RGB48BE: c->lumToYV12 = rgb48BEToY_c; break;
-     case PIX_FMT_RGB48LE: c->lumToYV12 = rgb48LEToY_c; break;
-     case PIX_FMT_BGR48BE: c->lumToYV12 = bgr48BEToY_c; break;
-     case PIX_FMT_BGR48LE: c->lumToYV12 = bgr48LEToY_c; break;
-     case PIX_FMT_RGBA64BE:c->lumToYV12 = rgb64BEToY_c; break;
-     case PIX_FMT_RGBA64LE:c->lumToYV12 = rgb64LEToY_c; break;
+     case PIX_FMT_RGB4_BYTE:
+         c->lumToYV12 = palToY_c;
+         break;
+     case PIX_FMT_MONOBLACK:
+         c->lumToYV12 = monoblack2Y_c;
+         break;
+     case PIX_FMT_MONOWHITE:
+         c->lumToYV12 = monowhite2Y_c;
+         break;
+     case PIX_FMT_RGB32:
+         c->lumToYV12 = bgr32ToY_c;
+         break;
+     case PIX_FMT_RGB32_1:
+         c->lumToYV12 = bgr321ToY_c;
+         break;
+     case PIX_FMT_BGR32:
+         c->lumToYV12 = rgb32ToY_c;
+         break;
+     case PIX_FMT_BGR32_1:
+         c->lumToYV12 = rgb321ToY_c;
+         break;
+     case PIX_FMT_RGB48BE:
+         c->lumToYV12 = rgb48BEToY_c;
+         break;
+     case PIX_FMT_RGB48LE:
+         c->lumToYV12 = rgb48LEToY_c;
+         break;
+     case PIX_FMT_BGR48BE:
+         c->lumToYV12 = bgr48BEToY_c;
+         break;
+     case PIX_FMT_BGR48LE:
+         c->lumToYV12 = bgr48LEToY_c;
+         break;
++    case PIX_FMT_RGBA64BE:
++        c->lumToYV12 = rgb64BEToY_c;
++        break;
++    case PIX_FMT_RGBA64LE:
++        c->lumToYV12 = rgb64LEToY_c;
++        break;
      }
      if (c->alpPixBuf) {
          switch (srcFormat) {
 +        case PIX_FMT_RGBA64LE:
 +        case PIX_FMT_RGBA64BE:  c->alpToYV12 = rgba64ToA_c; break;
          case PIX_FMT_BGRA:
-         case PIX_FMT_RGBA:  c->alpToYV12 = rgbaToA_c; break;
+         case PIX_FMT_RGBA:
+             c->alpToYV12 = rgbaToA_c;
+             break;
          case PIX_FMT_ABGR:
-         case PIX_FMT_ARGB:  c->alpToYV12 = abgrToA_c; break;
-         case PIX_FMT_Y400A: c->alpToYV12 = uyvyToY_c; break;
-         case PIX_FMT_PAL8 : c->alpToYV12 = palToA_c; break;
+         case PIX_FMT_ARGB:
+             c->alpToYV12 = abgrToA_c;
+             break;
+         case PIX_FMT_Y400A:
+             c->alpToYV12 = uyvyToY_c;
+             break;
++        case PIX_FMT_PAL8 :
++            c->alpToYV12 = palToA_c;
++            break;
          }
      }
  }
@@@ -1,48 -1,53 +1,48 @@@
 -ret: 0         st: 1 flags:1 dts:-0.011000 pts:-0.011000 pos:    512 size:   208
 +ret: 0         st: 1 flags:1 dts:-0.011000 pts:-0.011000 pos:    555 size:   208
  ret: 0         st:-1 flags:0  ts:-1.000000
 -ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    512 size:   208
 +ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    555 size:   208
  ret: 0         st:-1 flags:1  ts: 1.894167
 -ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292150 size: 27834
 +ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292193 size: 27834
  ret: 0         st: 0 flags:0  ts: 0.788000
 -ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292150 size: 27834
 +ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292193 size: 27834
  ret: 0         st: 0 flags:1  ts:-0.317000
 -ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    512 size:   208
 -ret: 0         st: 1 flags:0  ts: 2.577000
 -ret:-EOF
 +ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    555 size:   208
 +ret:-1         st: 1 flags:0  ts: 2.577000
  ret: 0         st: 1 flags:1  ts: 1.471000
 -ret: 0         st: 1 flags:1 dts: 0.982000 pts: 0.982000 pos: 319991 size:   209
 +ret: 0         st: 1 flags:1 dts: 1.008000 pts: 1.008000 pos: 320250 size:   209
  ret: 0         st:-1 flags:0  ts: 0.365002
 -ret: 0         st: 0 flags:1 dts: 0.480000 pts: 0.480000 pos: 146703 size: 27925
 +ret: 0         st: 0 flags:1 dts: 0.480000 pts: 0.480000 pos: 146746 size: 27925
  ret: 0         st:-1 flags:1  ts:-0.740831
 -ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    512 size:   208
 -ret: 0         st: 0 flags:0  ts: 2.153000
 -ret:-EOF
 +ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    555 size:   208
 +ret:-1         st: 0 flags:0  ts: 2.153000
  ret: 0         st: 0 flags:1  ts: 1.048000
 -ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292150 size: 27834
 +ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292193 size: 27834
  ret: 0         st: 1 flags:0  ts:-0.058000
 -ret: 0         st: 1 flags:1 dts: 0.015000 pts: 0.015000 pos:    512 size:   208
 +ret: 0         st: 1 flags:1 dts: 0.015000 pts: 0.015000 pos:    555 size:   208
  ret: 0         st: 1 flags:1  ts: 2.836000
 -ret: 0         st: 1 flags:1 dts: 0.982000 pts: 0.982000 pos: 319991 size:   209
 -ret: 0         st:-1 flags:0  ts: 1.730004
 -ret:-EOF
 +ret: 0         st: 1 flags:1 dts: 1.008000 pts: 1.008000 pos: 320250 size:   209
 +ret:-1         st:-1 flags:0  ts: 1.730004
  ret: 0         st:-1 flags:1  ts: 0.624171
 -ret: 0         st: 0 flags:1 dts: 0.480000 pts: 0.480000 pos: 146703 size: 27925
 +ret: 0         st: 0 flags:1 dts: 0.480000 pts: 0.480000 pos: 146746 size: 27925
  ret: 0         st: 0 flags:0  ts:-0.482000
 -ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    512 size:   208
 +ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    555 size:   208
  ret: 0         st: 0 flags:1  ts: 2.413000
 -ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292150 size: 27834
 -ret: 0         st: 1 flags:0  ts: 1.307000
 -ret:-EOF
 +ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292193 size: 27834
 +ret:-1         st: 1 flags:0  ts: 1.307000
  ret: 0         st: 1 flags:1  ts: 0.201000
- ret: 0         st: 1 flags:1 dts: 0.198000 pts: 0.198000 pos:    555 size:   208
 -ret: 0         st: 1 flags:1 dts: 0.015000 pts: 0.015000 pos:    512 size:   208
++ret: 0         st: 1 flags:1 dts: 0.015000 pts: 0.015000 pos:    555 size:   208
  ret: 0         st:-1 flags:0  ts:-0.904994
 -ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    512 size:   208
 +ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    555 size:   208
  ret: 0         st:-1 flags:1  ts: 1.989173
 -ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292150 size: 27834
 +ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292193 size: 27834
  ret: 0         st: 0 flags:0  ts: 0.883000
 -ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292150 size: 27834
 +ret: 0         st: 0 flags:1 dts: 0.960000 pts: 0.960000 pos: 292193 size: 27834
  ret: 0         st: 0 flags:1  ts:-0.222000
 -ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    512 size:   208
 -ret: 0         st: 1 flags:0  ts: 2.672000
 -ret:-EOF
 +ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    555 size:   208
 +ret:-1         st: 1 flags:0  ts: 2.672000
  ret: 0         st: 1 flags:1  ts: 1.566000
 -ret: 0         st: 1 flags:1 dts: 0.982000 pts: 0.982000 pos: 319991 size:   209
 +ret: 0         st: 1 flags:1 dts: 1.008000 pts: 1.008000 pos: 320250 size:   209
  ret: 0         st:-1 flags:0  ts: 0.460008
 -ret: 0         st: 0 flags:1 dts: 0.480000 pts: 0.480000 pos: 146703 size: 27925
 +ret: 0         st: 0 flags:1 dts: 0.480000 pts: 0.480000 pos: 146746 size: 27925
  ret: 0         st:-1 flags:1  ts:-0.645825
 -ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    512 size:   208
 +ret: 0         st: 1 flags:1 dts: 0.000000 pts: 0.000000 pos:    555 size:   208