OSDN Git Service

34b426f6dd5439dda41f6b5e45894c84e5c1788f
[handbrake-jp/handbrake-jp-git.git] / libhb / sync.c
1 /* $Id: sync.c,v 1.38 2005/04/14 21:57:58 titer Exp $
2
3    This file is part of the HandBrake source code.
4    Homepage: <http://handbrake.fr/>.
5    It may be used under the terms of the GNU General Public License. */
6
7 #include "hb.h"
8 #include <stdio.h>
9
10 #include "samplerate.h"
11 #include "ffmpeg/avcodec.h"
12
13 #ifdef INT64_MIN
14 #undef INT64_MIN /* Because it isn't defined correctly in Zeta */
15 #endif
16 #define INT64_MIN (-9223372036854775807LL-1)
17
18 #define AC3_SAMPLES_PER_FRAME 1536
19
20 typedef struct
21 {
22     hb_audio_t * audio;
23
24     int64_t      next_start;    /* start time of next output frame */
25     int64_t      next_pts;      /* start time of next input frame */
26     int64_t      start_silence; /* if we're inserting silence, the time we started */
27     int64_t      first_drop;    /* PTS of first 'went backwards' frame dropped */
28     int          drop_count;    /* count of 'time went backwards' drops */
29
30     /* Raw */
31     SRC_STATE  * state;
32     SRC_DATA     data;
33
34     /* AC-3 */
35     int          ac3_size;
36     uint8_t    * ac3_buf;
37
38 } hb_sync_audio_t;
39
40 struct hb_work_private_s
41 {
42     hb_job_t * job;
43     int        done;
44
45     /* Video */
46     hb_subtitle_t * subtitle;
47     int64_t pts_offset;
48     int64_t next_start;         /* start time of next output frame */
49     int64_t next_pts;           /* start time of next input frame */
50     int64_t first_drop;         /* PTS of first 'went backwards' frame dropped */
51     int drop_count;             /* count of 'time went backwards' drops */
52     int drops;                  /* frames dropped to make a cbr video stream */
53     int dups;                   /* frames duplicated to make a cbr video stream */
54     int video_sequence;
55     int count_frames;
56     int count_frames_max;
57     int chap_mark;              /* to propagate chapter mark across a drop */
58     hb_buffer_t * cur; /* The next picture to process */
59
60     /* Audio */
61     hb_sync_audio_t sync_audio[8];
62
63     /* Statistics */
64     uint64_t st_counts[4];
65     uint64_t st_dates[4];
66     uint64_t st_first;
67 };
68
69 /***********************************************************************
70  * Local prototypes
71  **********************************************************************/
72 static void InitAudio( hb_work_object_t * w, int i );
73 static int  SyncVideo( hb_work_object_t * w );
74 static void SyncAudio( hb_work_object_t * w, int i );
75 static int  NeedSilence( hb_work_object_t * w, hb_audio_t *, int i );
76 static void InsertSilence( hb_work_object_t * w, int i, int64_t d );
77 static void UpdateState( hb_work_object_t * w );
78
79 /***********************************************************************
80  * hb_work_sync_init
81  ***********************************************************************
82  * Initialize the work object
83  **********************************************************************/
84 int syncInit( hb_work_object_t * w, hb_job_t * job )
85 {
86     hb_title_t       * title = job->title;
87     hb_chapter_t     * chapter;
88     int                i;
89     uint64_t           duration;
90     hb_work_private_t * pv;
91
92     pv = calloc( 1, sizeof( hb_work_private_t ) );
93     w->private_data = pv;
94
95     pv->job            = job;
96     pv->pts_offset     = INT64_MIN;
97     pv->count_frames   = 0;
98
99     /* Calculate how many video frames we are expecting */
100     duration = 0;
101     for( i = job->chapter_start; i <= job->chapter_end; i++ )
102     {
103         chapter   = hb_list_item( title->list_chapter, i - 1 );
104         duration += chapter->duration;
105     }
106     duration += 90000;
107         /* 1 second safety so we're sure we won't miss anything */
108     pv->count_frames_max = duration * job->vrate / job->vrate_base / 90000;
109
110     hb_log( "sync: expecting %d video frames", pv->count_frames_max );
111
112     /* Initialize libsamplerate for every audio track we have */
113     for( i = 0; i < hb_list_count( title->list_audio ); i++ )
114     {
115         InitAudio( w, i );
116     }
117
118     /* Get subtitle info, if any */
119     pv->subtitle = hb_list_item( title->list_subtitle, 0 );
120
121     pv->video_sequence = 0;
122
123     return 0;
124 }
125
126 /***********************************************************************
127  * Close
128  ***********************************************************************
129  *
130  **********************************************************************/
131 void syncClose( hb_work_object_t * w )
132 {
133     hb_work_private_t * pv = w->private_data;
134     hb_job_t          * job   = pv->job;
135     hb_title_t        * title = job->title;
136     hb_audio_t        * audio = NULL;
137     int i;
138
139     if( pv->cur )
140     {
141         hb_buffer_close( &pv->cur );
142     }
143
144     hb_log( "sync: got %d frames, %d expected",
145             pv->count_frames, pv->count_frames_max );
146
147     if (pv->drops || pv->dups )
148     {
149         hb_log( "sync: %d frames dropped, %d duplicated", pv->drops, pv->dups );
150     }
151
152     for( i = 0; i < hb_list_count( title->list_audio ); i++ )
153     {
154         if ( pv->sync_audio[i].start_silence )
155         {
156             hb_log( "sync: added %d ms of silence to audio %d",
157                     (int)((pv->sync_audio[i].next_pts -
158                               pv->sync_audio[i].start_silence) / 90), i );
159         }
160
161         audio = hb_list_item( title->list_audio, i );
162         if( audio->config.out.codec == HB_ACODEC_AC3 )
163         {
164             free( pv->sync_audio[i].ac3_buf );
165         }
166         else
167         {
168             src_delete( pv->sync_audio[i].state );
169         }
170     }
171
172     free( pv );
173     w->private_data = NULL;
174 }
175
176 /***********************************************************************
177  * Work
178  ***********************************************************************
179  * The root routine of this work abject
180  *
181  * The way this works is that we are syncing the audio to the PTS of
182  * the last video that we processed. That's why we skip the audio sync
183  * if we haven't got a valid PTS from the video yet.
184  *
185  **********************************************************************/
186 int syncWork( hb_work_object_t * w, hb_buffer_t ** unused1,
187               hb_buffer_t ** unused2 )
188 {
189     hb_work_private_t * pv = w->private_data;
190     int i;
191
192     /* If we ever got a video frame, handle audio now */
193     if( pv->pts_offset != INT64_MIN )
194     {
195         for( i = 0; i < hb_list_count( pv->job->title->list_audio ); i++ )
196         {
197             SyncAudio( w, i );
198         }
199     }
200
201     /* Handle video */
202     return SyncVideo( w );
203 }
204
205 hb_work_object_t hb_sync =
206 {
207     WORK_SYNC,
208     "Synchronization",
209     syncInit,
210     syncWork,
211     syncClose
212 };
213
214 static void InitAudio( hb_work_object_t * w, int i )
215 {
216     hb_work_private_t * pv = w->private_data;
217     hb_job_t        * job   = pv->job;
218     hb_title_t      * title = job->title;
219     hb_sync_audio_t * sync;
220
221     sync        = &pv->sync_audio[i];
222     sync->audio = hb_list_item( title->list_audio, i );
223
224     if( sync->audio->config.out.codec == HB_ACODEC_AC3 )
225     {
226         /* Have a silent AC-3 frame ready in case we have to fill a
227            gap */
228         AVCodec        * codec;
229         AVCodecContext * c;
230         short          * zeros;
231
232         codec = avcodec_find_encoder( CODEC_ID_AC3 );
233         c     = avcodec_alloc_context();
234
235         c->bit_rate    = sync->audio->config.in.bitrate;
236         c->sample_rate = sync->audio->config.in.samplerate;
237         c->channels    = HB_INPUT_CH_LAYOUT_GET_DISCRETE_COUNT( sync->audio->config.in.channel_layout );
238
239         if( avcodec_open( c, codec ) < 0 )
240         {
241             hb_log( "sync: avcodec_open failed" );
242             return;
243         }
244
245         zeros          = calloc( AC3_SAMPLES_PER_FRAME *
246                                  sizeof( short ) * c->channels, 1 );
247         sync->ac3_size = sync->audio->config.in.bitrate * AC3_SAMPLES_PER_FRAME /
248                              sync->audio->config.in.samplerate / 8;
249         sync->ac3_buf  = malloc( sync->ac3_size );
250
251         if( avcodec_encode_audio( c, sync->ac3_buf, sync->ac3_size,
252                                   zeros ) != sync->ac3_size )
253         {
254             hb_log( "sync: avcodec_encode_audio failed" );
255         }
256
257         free( zeros );
258         avcodec_close( c );
259         av_free( c );
260     }
261     else
262     {
263         /* Initialize libsamplerate */
264         int error;
265         sync->state             = src_new( SRC_LINEAR, HB_AMIXDOWN_GET_DISCRETE_CHANNEL_COUNT(sync->audio->config.out.mixdown), &error );
266         sync->data.end_of_input = 0;
267     }
268 }
269
270 /***********************************************************************
271  * SyncVideo
272  ***********************************************************************
273  *
274  **********************************************************************/
275 static int SyncVideo( hb_work_object_t * w )
276 {
277     hb_work_private_t * pv = w->private_data;
278     hb_buffer_t * cur, * next, * sub = NULL;
279     hb_job_t * job = pv->job;
280
281     if( pv->done )
282     {
283         return HB_WORK_DONE;
284     }
285
286     if( !pv->cur && !( pv->cur = hb_fifo_get( job->fifo_raw ) ) )
287     {
288         /* We haven't even got a frame yet */
289         return HB_WORK_OK;
290     }
291     cur = pv->cur;
292     if( cur->size == 0 )
293     {
294         /* we got an end-of-stream. Feed it downstream & signal that we're done. */
295         hb_fifo_push( job->fifo_sync, hb_buffer_init( 0 ) );
296         pv->done = 1;
297         return HB_WORK_DONE;
298     }
299
300     /* At this point we have a frame to process. Let's check
301         1) if we will be able to push into the fifo ahead
302         2) if the next frame is there already, since we need it to
303            compute the duration of the current frame*/
304     while( !hb_fifo_is_full( job->fifo_sync ) &&
305            ( next = hb_fifo_see( job->fifo_raw ) ) )
306     {
307         hb_buffer_t * buf_tmp;
308
309         if( next->size == 0 )
310         {
311             /* we got an end-of-stream. Feed it downstream & signal that
312              * we're done. Note that this means we drop the final frame of
313              * video (we don't know its duration). On DVDs the final frame
314              * is often strange and dropping it seems to be a good idea. */
315             hb_fifo_push( job->fifo_sync, hb_buffer_init( 0 ) );
316             pv->done = 1;
317             return HB_WORK_DONE;
318         }
319         if( pv->pts_offset == INT64_MIN )
320         {
321             /* This is our first frame */
322             pv->pts_offset = 0;
323             if ( cur->start != 0 )
324             {
325                 /*
326                  * The first pts from a dvd should always be zero but
327                  * can be non-zero with a transport or program stream since
328                  * we're not guaranteed to start on an IDR frame. If we get
329                  * a non-zero initial PTS extend its duration so it behaves
330                  * as if it started at zero so that our audio timing will
331                  * be in sync.
332                  */
333                 hb_log( "sync: first pts is %lld", cur->start );
334                 cur->start = 0;
335             }
336         }
337
338         /*
339          * since the first frame is always 0 and the upstream reader code
340          * is taking care of adjusting for pts discontinuities, we just have
341          * to deal with the next frame's start being in the past. This can
342          * happen when the PTS is adjusted after data loss but video frame
343          * reordering causes some frames with the old clock to appear after
344          * the clock change. This creates frames that overlap in time which
345          * looks to us like time going backward. The downstream muxing code
346          * can deal with overlaps of up to a frame time but anything larger
347          * we handle by dropping frames here.
348          */
349         if ( (int64_t)( next->start - pv->next_pts ) <= 0 )
350         {
351             if ( pv->first_drop == 0 )
352             {
353                 pv->first_drop = next->start;
354             }
355             ++pv->drop_count;
356             buf_tmp = hb_fifo_get( job->fifo_raw );
357             if ( buf_tmp->new_chap )
358             {
359                 // don't drop a chapter mark when we drop the buffer
360                 pv->chap_mark = buf_tmp->new_chap;
361             }
362             hb_buffer_close( &buf_tmp );
363             continue;
364         }
365         if ( pv->first_drop )
366         {
367             hb_log( "sync: video time didn't advance - dropped %d frames "
368                     "(delta %d ms, current %lld, next %lld)",
369                     pv->drop_count, (int)( pv->next_pts - pv->first_drop ) / 90,
370                     pv->next_pts, pv->first_drop );
371             pv->first_drop = 0;
372             pv->drop_count = 0;
373         }
374
375         /*
376          * Track the video sequence number localy so that we can sync the audio
377          * to it using the sequence number as well as the PTS.
378          */
379         pv->video_sequence = cur->sequence;
380
381         /* Look for a subtitle for this frame */
382         if( pv->subtitle )
383         {
384             hb_buffer_t * sub2;
385             while( ( sub = hb_fifo_see( pv->subtitle->fifo_raw ) ) )
386             {
387                 /* If two subtitles overlap, make the first one stop
388                    when the second one starts */
389                 sub2 = hb_fifo_see2( pv->subtitle->fifo_raw );
390                 if( sub2 && sub->stop > sub2->start )
391                     sub->stop = sub2->start;
392
393                 // hb_log("0x%x: video seq: %lld  subtitle sequence: %lld",
394                 //       sub, cur->sequence, sub->sequence);
395
396                 if( sub->sequence > cur->sequence )
397                 {
398                     /*
399                      * The video is behind where we are, so wait until
400                      * it catches up to the same reader point on the
401                      * DVD. Then our PTS should be in the same region
402                      * as the video.
403                      */
404                     sub = NULL;
405                     break;
406                 }
407
408                 if( sub->stop > cur->start ) {
409                     /*
410                      * The stop time is in the future, so fall through
411                      * and we'll deal with it in the next block of
412                      * code.
413                      */
414                     break;
415                 }
416
417                 /*
418                  * The subtitle is older than this picture, trash it
419                  */
420                 sub = hb_fifo_get( pv->subtitle->fifo_raw );
421                 hb_buffer_close( &sub );
422             }
423
424             /*
425              * There is a valid subtitle, is it time to display it?
426              */
427             if( sub )
428             {
429                 if( sub->stop > sub->start)
430                 {
431                     /*
432                      * Normal subtitle which ends after it starts, check to
433                      * see that the current video is between the start and end.
434                      */
435                     if( cur->start > sub->start &&
436                         cur->start < sub->stop )
437                     {
438                         /*
439                          * We should be playing this, so leave the
440                          * subtitle in place.
441                          *
442                          * fall through to display
443                          */
444                         if( ( sub->stop - sub->start ) < ( 3 * 90000 ) )
445                         {
446                             /*
447                              * Subtitle is on for less than three seconds, extend
448                              * the time that it is displayed to make it easier
449                              * to read. Make it 3 seconds or until the next
450                              * subtitle is displayed.
451                              *
452                              * This is in response to Indochine which only
453                              * displays subs for 1 second - too fast to read.
454                              */
455                             sub->stop = sub->start + ( 3 * 90000 );
456
457                             sub2 = hb_fifo_see2( pv->subtitle->fifo_raw );
458
459                             if( sub2 && sub->stop > sub2->start )
460                             {
461                                 sub->stop = sub2->start;
462                             }
463                         }
464                     }
465                     else
466                     {
467                         /*
468                          * Defer until the play point is within the subtitle
469                          */
470                         sub = NULL;
471                     }
472                 }
473                 else
474                 {
475                     /*
476                      * The end of the subtitle is less than the start, this is a
477                      * sign of a PTS discontinuity.
478                      */
479                     if( sub->start > cur->start )
480                     {
481                         /*
482                          * we haven't reached the start time yet, or
483                          * we have jumped backwards after having
484                          * already started this subtitle.
485                          */
486                         if( cur->start < sub->stop )
487                         {
488                             /*
489                              * We have jumped backwards and so should
490                              * continue displaying this subtitle.
491                              *
492                              * fall through to display.
493                              */
494                         }
495                         else
496                         {
497                             /*
498                              * Defer until the play point is within the subtitle
499                              */
500                             sub = NULL;
501                         }
502                     } else {
503                         /*
504                          * Play this subtitle as the start is greater than our
505                          * video point.
506                          *
507                          * fall through to display/
508                          */
509                     }
510                 }
511             }
512         }
513
514         int64_t duration;
515         if ( job->mux & HB_MUX_AVI || job->title->rate_base != job->vrate_base )
516         {
517             /*
518              * The concept of variable frame rate video was a bit too advanced
519              * for Microsoft so AVI doesn't support it. Since almost all dvd
520              * video is VFR we have to convert it to constant frame rate to
521              * put it in an AVI container. So here we duplicate, drop and
522              * otherwise trash video frames to appease the gods of Redmond.
523              */
524
525             /* mpeg durations are exact when expressed in ticks of the
526              * 27MHz System clock but not in HB's 90KHz PTS clock. To avoid
527              * a truncation bias that will eventually cause the audio to desync
528              * we compute the duration of the next frame using 27MHz ticks
529              * then truncate it to 90KHz. */
530             duration = ( (int64_t)(pv->count_frames + 1 ) * job->vrate_base ) / 300 -
531                        pv->next_start;
532
533             /* We don't want the input & output clocks to be exactly in phase
534              * otherwise small variations in the time will cause us to think
535              * we're a full frame off & there will be lots of drops and dups.
536              * We offset the input clock by half the duration so it's maximally
537              * out of phase with the output clock. */
538             if( cur->start < pv->next_start  - ( duration >> 1 ) )
539             {
540                 /* current frame too old - drop it */
541                 if ( cur->new_chap )
542                 {
543                     pv->chap_mark = cur->new_chap;
544                 }
545                 hb_buffer_close( &cur );
546                 pv->cur = cur = hb_fifo_get( job->fifo_raw );
547                 pv->next_pts = next->start;
548                 ++pv->drops;
549                 continue;
550             }
551
552             if( next->start > pv->next_start + duration + ( duration >> 1 ) )
553             {
554                 /* next frame too far ahead - dup current frame */
555                 buf_tmp = hb_buffer_init( cur->size );
556                 hb_buffer_copy_settings( buf_tmp, cur );
557                 memcpy( buf_tmp->data, cur->data, cur->size );
558                 buf_tmp->sequence = cur->sequence;
559                 ++pv->dups;
560             }
561             else
562             {
563                 /* this frame in our time window & doesn't need to be duped */
564                 buf_tmp = cur;
565                 pv->cur = cur = hb_fifo_get( job->fifo_raw );
566                 pv->next_pts = next->start;
567             }
568         }
569         else
570         {
571             /*
572              * Adjust the pts of the current frame so that it's contiguous
573              * with the previous frame. The start time of the current frame
574              * has to be the end time of the previous frame and the stop
575              * time has to be the start of the next frame.  We don't
576              * make any adjustments to the source timestamps other than removing
577              * the clock offsets (which also removes pts discontinuities).
578              * This means we automatically encode at the source's frame rate.
579              * MP2 uses an implicit duration (frames end when the next frame
580              * starts) but more advanced containers like MP4 use an explicit
581              * duration. Since we're looking ahead one frame we set the
582              * explicit stop time from the start time of the next frame.
583              */
584             buf_tmp = cur;
585             pv->cur = cur = hb_fifo_get( job->fifo_raw );
586             pv->next_pts = next->start;
587             duration = next->start - buf_tmp->start;
588             if ( duration <= 0 )
589             {
590                 hb_log( "sync: invalid video duration %lld, start %lld, next %lld",
591                         duration, buf_tmp->start, next->start );
592             }
593         }
594
595         buf_tmp->start = pv->next_start;
596         pv->next_start += duration;
597         buf_tmp->stop = pv->next_start;
598
599         if ( pv->chap_mark )
600         {
601             // we have a pending chapter mark from a recent drop - put it on this
602             // buffer (this may make it one frame late but we can't do any better).
603             buf_tmp->new_chap = pv->chap_mark;
604             pv->chap_mark = 0;
605         }
606
607         /* If we have a subtitle for this picture, copy it */
608         /* FIXME: we should avoid this memcpy */
609         if( sub )
610         {
611             buf_tmp->sub         = hb_buffer_init( sub->size );
612             buf_tmp->sub->x      = sub->x;
613             buf_tmp->sub->y      = sub->y;
614             buf_tmp->sub->width  = sub->width;
615             buf_tmp->sub->height = sub->height;
616             memcpy( buf_tmp->sub->data, sub->data, sub->size );
617         }
618
619         /* Push the frame to the renderer */
620         hb_fifo_push( job->fifo_sync, buf_tmp );
621
622         /* Update UI */
623         UpdateState( w );
624
625         /* Make sure we won't get more frames then expected */
626         if( pv->count_frames >= pv->count_frames_max * 2)
627         {
628             hb_log( "sync: got too many frames (%d), exiting early",
629                     pv->count_frames );
630             pv->done = 1;
631
632             // Drop an empty buffer into our output to ensure that things
633             // get flushed all the way out.
634             hb_fifo_push( job->fifo_sync, hb_buffer_init( 0 ) );
635             return HB_WORK_DONE;
636         }
637     }
638     return HB_WORK_OK;
639 }
640
641 static void OutputAudioFrame( hb_job_t *job, hb_audio_t *audio, hb_buffer_t *buf,
642                               hb_sync_audio_t *sync, hb_fifo_t *fifo, int i )
643 {
644     int64_t start = sync->next_start;
645     int64_t duration = buf->stop - buf->start;
646
647     sync->next_pts += duration;
648
649     if( audio->config.in.samplerate == audio->config.out.samplerate ||
650         audio->config.out.codec == HB_ACODEC_AC3 ||
651         audio->config.out.codec == HB_ACODEC_DCA )
652     {
653         /*
654          * If we don't have to do sample rate conversion or this audio is 
655          * pass-thru just send the input buffer downstream after adjusting
656          * its timestamps to make the output stream continuous.
657          */
658     }
659     else
660     {
661         /* Not pass-thru - do sample rate conversion */
662         int count_in, count_out;
663         hb_buffer_t * buf_raw = buf;
664         int channel_count = HB_AMIXDOWN_GET_DISCRETE_CHANNEL_COUNT(audio->config.out.mixdown) *
665                             sizeof( float );
666
667         count_in  = buf_raw->size / channel_count;
668         /*
669          * When using stupid rates like 44.1 there will always be some
670          * truncation error. E.g., a 1536 sample AC3 frame will turn into a
671          * 1536*44.1/48.0 = 1411.2 sample frame. If we just truncate the .2
672          * the error will build up over time and eventually the audio will
673          * substantially lag the video. libsamplerate will keep track of the
674          * fractional sample & give it to us when appropriate if we give it
675          * an extra sample of space in the output buffer.
676          */
677         count_out = ( duration * audio->config.out.samplerate ) / 90000 + 1;
678
679         sync->data.input_frames = count_in;
680         sync->data.output_frames = count_out;
681         sync->data.src_ratio = (double)audio->config.out.samplerate /
682                                (double)audio->config.in.samplerate;
683
684         buf = hb_buffer_init( count_out * channel_count );
685         sync->data.data_in  = (float *) buf_raw->data;
686         sync->data.data_out = (float *) buf->data;
687         if( src_process( sync->state, &sync->data ) )
688         {
689             /* XXX If this happens, we're screwed */
690             hb_log( "sync: audio %d src_process failed", i );
691         }
692         hb_buffer_close( &buf_raw );
693
694         buf->size = sync->data.output_frames_gen * channel_count;
695         duration = ( sync->data.output_frames_gen * 90000 ) /
696                    audio->config.out.samplerate;
697     }
698     buf->frametype = HB_FRAME_AUDIO;
699     buf->start = start;
700     buf->stop  = start + duration;
701     sync->next_start = start + duration;
702     hb_fifo_push( fifo, buf );
703 }
704
705 /***********************************************************************
706  * SyncAudio
707  ***********************************************************************
708  *
709  **********************************************************************/
710 static void SyncAudio( hb_work_object_t * w, int i )
711 {
712     hb_work_private_t * pv = w->private_data;
713     hb_job_t        * job = pv->job;
714     hb_sync_audio_t * sync = &pv->sync_audio[i];
715     hb_audio_t      * audio = sync->audio;
716     hb_buffer_t     * buf;
717     hb_fifo_t       * fifo;
718
719     if( audio->config.out.codec == HB_ACODEC_AC3 )
720     {
721         fifo = audio->priv.fifo_out;
722     }
723     else
724     {
725         fifo = audio->priv.fifo_sync;
726     }
727
728     while( !hb_fifo_is_full( fifo ) && ( buf = hb_fifo_see( audio->priv.fifo_raw ) ) )
729     {
730         if ( (int64_t)( buf->start - sync->next_pts ) < 0 )
731         {
732             /*
733              * audio time went backwards by more than a frame time (this can
734              * happen when we reset the PTS because of lost data).
735              * Discard data that's in the past.
736              */
737             if ( sync->first_drop == 0 )
738             {
739                 sync->first_drop = buf->start;
740             }
741             ++sync->drop_count;
742             buf = hb_fifo_get( audio->priv.fifo_raw );
743             hb_buffer_close( &buf );
744             continue;
745         }
746         if ( sync->first_drop )
747         {
748             hb_log( "sync: audio %d time went backwards %d ms, dropped %d frames "
749                     "(next %lld, current %lld)", i,
750                     (int)( sync->next_pts - sync->first_drop ) / 90,
751                     sync->drop_count, sync->first_drop, sync->next_pts );
752             sync->first_drop = 0;
753             sync->drop_count = 0;
754         }
755         if ( buf->start - sync->next_pts >= (90 * 70) )
756         {
757             /*
758              * there's a gap of at least 70ms between the last
759              * frame we processed & the next. Fill it with silence.
760              */
761             hb_log( "sync: adding %d ms of silence to audio %d"
762                     "  start %lld, next %lld",
763                     (int)((buf->start - sync->next_pts) / 90),
764                     i, buf->start, sync->next_pts );
765             InsertSilence( w, i, buf->start - sync->next_pts );
766             return;
767         }
768
769         /*
770          * When we get here we've taken care of all the dups and gaps in the
771          * audio stream and are ready to inject the next input frame into
772          * the output stream.
773          */
774         buf = hb_fifo_get( audio->priv.fifo_raw );
775         OutputAudioFrame( job, audio, buf, sync, fifo, i );
776     }
777
778     if( NeedSilence( w, audio, i ) )
779     {
780         InsertSilence( w, i, (90000 * AC3_SAMPLES_PER_FRAME) /
781                              sync->audio->config.in.samplerate );
782     }
783 }
784
785 static int NeedSilence( hb_work_object_t * w, hb_audio_t * audio, int i )
786 {
787     hb_work_private_t * pv = w->private_data;
788     hb_job_t * job = pv->job;
789     hb_sync_audio_t * sync = &pv->sync_audio[i];
790
791     if( hb_fifo_size( audio->priv.fifo_in ) ||
792         hb_fifo_size( audio->priv.fifo_raw ) ||
793         hb_fifo_size( audio->priv.fifo_sync ) ||
794         hb_fifo_size( audio->priv.fifo_out ) )
795     {
796         /* We have some audio, we are fine */
797         return 0;
798     }
799
800     /* No audio left in fifos */
801
802     if( hb_thread_has_exited( job->reader ) )
803     {
804         /* We might miss some audio to complete encoding and muxing
805            the video track */
806         if ( sync->start_silence == 0 )
807         {
808             hb_log("sync: reader has exited, adding silence to audio %d", i);
809             sync->start_silence = sync->next_pts;
810         }
811         return 1;
812     }
813     return 0;
814 }
815
816 static void InsertSilence( hb_work_object_t * w, int i, int64_t duration )
817 {
818     hb_work_private_t * pv = w->private_data;
819     hb_job_t        *job = pv->job;
820     hb_sync_audio_t *sync = &pv->sync_audio[i];
821     hb_buffer_t     *buf;
822     hb_fifo_t       *fifo;
823
824     // to keep pass-thru and regular audio in sync we generate silence in
825     // AC3 frame-sized units. If the silence duration isn't an integer multiple
826     // of the AC3 frame duration we will truncate or round up depending on
827     // which minimizes the timing error.
828     const int frame_dur = ( 90000 * AC3_SAMPLES_PER_FRAME ) /
829                           sync->audio->config.in.samplerate;
830     int frame_count = ( duration + (frame_dur >> 1) ) / frame_dur;
831
832     while ( --frame_count >= 0 )
833     {
834         if( sync->audio->config.out.codec == HB_ACODEC_AC3 )
835         {
836             buf        = hb_buffer_init( sync->ac3_size );
837             buf->start = sync->next_pts;
838             buf->stop  = buf->start + frame_dur;
839             memcpy( buf->data, sync->ac3_buf, buf->size );
840             fifo = sync->audio->priv.fifo_out;
841         }
842         else
843         {
844             buf = hb_buffer_init( AC3_SAMPLES_PER_FRAME * sizeof( float ) *
845                                      HB_AMIXDOWN_GET_DISCRETE_CHANNEL_COUNT(
846                                          sync->audio->config.out.mixdown) );
847             buf->start = sync->next_pts;
848             buf->stop  = buf->start + frame_dur;
849             memset( buf->data, 0, buf->size );
850             fifo = sync->audio->priv.fifo_sync;
851         }
852         OutputAudioFrame( job, sync->audio, buf, sync, fifo, i );
853     }
854 }
855
856 static void UpdateState( hb_work_object_t * w )
857 {
858     hb_work_private_t * pv = w->private_data;
859     hb_state_t state;
860
861     if( !pv->count_frames )
862     {
863         pv->st_first = hb_get_date();
864     }
865     pv->count_frames++;
866
867     if( hb_get_date() > pv->st_dates[3] + 1000 )
868     {
869         memmove( &pv->st_dates[0], &pv->st_dates[1],
870                  3 * sizeof( uint64_t ) );
871         memmove( &pv->st_counts[0], &pv->st_counts[1],
872                  3 * sizeof( uint64_t ) );
873         pv->st_dates[3]  = hb_get_date();
874         pv->st_counts[3] = pv->count_frames;
875     }
876
877 #define p state.param.working
878     state.state = HB_STATE_WORKING;
879     p.progress  = (float) pv->count_frames / (float) pv->count_frames_max;
880     if( p.progress > 1.0 )
881     {
882         p.progress = 1.0;
883     }
884     p.rate_cur   = 1000.0 *
885         (float) ( pv->st_counts[3] - pv->st_counts[0] ) /
886         (float) ( pv->st_dates[3] - pv->st_dates[0] );
887     if( hb_get_date() > pv->st_first + 4000 )
888     {
889         int eta;
890         p.rate_avg = 1000.0 * (float) pv->st_counts[3] /
891             (float) ( pv->st_dates[3] - pv->st_first );
892         eta = (float) ( pv->count_frames_max - pv->st_counts[3] ) /
893             p.rate_avg;
894         p.hours   = eta / 3600;
895         p.minutes = ( eta % 3600 ) / 60;
896         p.seconds = eta % 60;
897     }
898     else
899     {
900         p.rate_avg = 0.0;
901         p.hours    = -1;
902         p.minutes  = -1;
903         p.seconds  = -1;
904     }
905 #undef p
906
907     hb_set_state( pv->job->h, &state );
908 }