OSDN Git Service

Stage 1 Soft Subtitle Support - Allow multiple subtitle tracks to be selected, and...
[handbrake-jp/handbrake-jp-git.git] / libhb / sync.c
1 /* $Id: sync.c,v 1.38 2005/04/14 21:57:58 titer Exp $
2
3    This file is part of the HandBrake source code.
4    Homepage: <http://handbrake.fr/>.
5    It may be used under the terms of the GNU General Public License. */
6
7 #include "hb.h"
8 #include "hbffmpeg.h"
9 #include <stdio.h>
10 #include "samplerate.h"
11
12 #ifdef INT64_MIN
13 #undef INT64_MIN /* Because it isn't defined correctly in Zeta */
14 #endif
15 #define INT64_MIN (-9223372036854775807LL-1)
16
17 #define AC3_SAMPLES_PER_FRAME 1536
18
19 typedef struct
20 {
21     hb_audio_t * audio;
22
23     int64_t      next_start;    /* start time of next output frame */
24     int64_t      next_pts;      /* start time of next input frame */
25     int64_t      first_drop;    /* PTS of first 'went backwards' frame dropped */
26     int          drop_count;    /* count of 'time went backwards' drops */
27
28     /* Raw */
29     SRC_STATE  * state;
30     SRC_DATA     data;
31
32     /* AC-3 */
33     int          ac3_size;
34     uint8_t    * ac3_buf;
35
36 } hb_sync_audio_t;
37
38 struct hb_work_private_s
39 {
40     hb_job_t * job;
41     int        busy;            // bitmask with one bit for each active input
42                                 // (bit 0 = video; 1 = audio 0, 2 = audio 1, ...
43                                 // appropriate bit is cleared when input gets
44                                 // an eof buf. syncWork returns done when all
45                                 // bits are clear.
46     /* Video */
47     int64_t pts_offset;
48     int64_t next_start;         /* start time of next output frame */
49     int64_t next_pts;           /* start time of next input frame */
50     int64_t first_drop;         /* PTS of first 'went backwards' frame dropped */
51     int drop_count;             /* count of 'time went backwards' drops */
52     int drops;                  /* frames dropped to make a cbr video stream */
53     int dups;                   /* frames duplicated to make a cbr video stream */
54     int video_sequence;
55     int count_frames;
56     int count_frames_max;
57     int chap_mark;              /* to propagate chapter mark across a drop */
58     hb_buffer_t * cur; /* The next picture to process */
59
60     /* Audio */
61     hb_sync_audio_t sync_audio[8];
62     int64_t audio_passthru_slip;
63
64     /* Statistics */
65     uint64_t st_counts[4];
66     uint64_t st_dates[4];
67     uint64_t st_first;
68 };
69
70 /***********************************************************************
71  * Local prototypes
72  **********************************************************************/
73 static void InitAudio( hb_work_object_t * w, int i );
74 static void SyncVideo( hb_work_object_t * w );
75 static void SyncAudio( hb_work_object_t * w, int i );
76 static void InsertSilence( hb_work_object_t * w, int i, int64_t d );
77 static void UpdateState( hb_work_object_t * w );
78
79 /***********************************************************************
80  * hb_work_sync_init
81  ***********************************************************************
82  * Initialize the work object
83  **********************************************************************/
84 int syncInit( hb_work_object_t * w, hb_job_t * job )
85 {
86     hb_title_t       * title = job->title;
87     hb_chapter_t     * chapter;
88     int                i;
89     uint64_t           duration;
90     hb_work_private_t * pv;
91
92     pv = calloc( 1, sizeof( hb_work_private_t ) );
93     w->private_data = pv;
94
95     pv->job            = job;
96     pv->pts_offset     = INT64_MIN;
97
98     /* Calculate how many video frames we are expecting */
99     if (job->pts_to_stop)
100     {
101         duration = job->pts_to_stop + 90000;
102     }
103     else if( job->frame_to_stop )
104     {
105         /* Set the duration to a rough estimate */
106         duration = ( job->frame_to_stop / ( job->vrate / job->vrate_base ) ) * 90000;
107     }
108     else
109     {
110         duration = 0;
111         for( i = job->chapter_start; i <= job->chapter_end; i++ )
112         {
113             chapter   = hb_list_item( title->list_chapter, i - 1 );
114             duration += chapter->duration;
115         }
116         duration += 90000;
117         /* 1 second safety so we're sure we won't miss anything */
118     }
119     pv->count_frames_max = duration * job->vrate / job->vrate_base / 90000;
120
121     hb_log( "sync: expecting %d video frames", pv->count_frames_max );
122     pv->busy |= 1;
123
124     /* Initialize libsamplerate for every audio track we have */
125     if ( ! job->indepth_scan )
126     {
127         for( i = 0; i < hb_list_count( title->list_audio ) && i < 8; i++ )
128         {
129             pv->busy |= ( 1 << (i + 1) );
130             InitAudio( w, i );
131         }
132     }
133
134     return 0;
135 }
136
137 /***********************************************************************
138  * Close
139  ***********************************************************************
140  *
141  **********************************************************************/
142 void syncClose( hb_work_object_t * w )
143 {
144     hb_work_private_t * pv = w->private_data;
145     hb_job_t          * job   = pv->job;
146     hb_title_t        * title = job->title;
147     hb_audio_t        * audio = NULL;
148     int i;
149
150     if( pv->cur )
151     {
152         hb_buffer_close( &pv->cur );
153     }
154
155     hb_log( "sync: got %d frames, %d expected",
156             pv->count_frames, pv->count_frames_max );
157
158     if (pv->drops || pv->dups )
159     {
160         hb_log( "sync: %d frames dropped, %d duplicated", pv->drops, pv->dups );
161     }
162
163     for( i = 0; i < hb_list_count( title->list_audio ); i++ )
164     {
165         audio = hb_list_item( title->list_audio, i );
166         if( audio->config.out.codec == HB_ACODEC_AC3 )
167         {
168             free( pv->sync_audio[i].ac3_buf );
169         }
170         else
171         {
172             src_delete( pv->sync_audio[i].state );
173         }
174     }
175
176     free( pv );
177     w->private_data = NULL;
178 }
179
180 /***********************************************************************
181  * Work
182  ***********************************************************************
183  * The root routine of this work abject
184  *
185  * The way this works is that we are syncing the audio to the PTS of
186  * the last video that we processed. That's why we skip the audio sync
187  * if we haven't got a valid PTS from the video yet.
188  *
189  **********************************************************************/
190 int syncWork( hb_work_object_t * w, hb_buffer_t ** unused1,
191               hb_buffer_t ** unused2 )
192 {
193     hb_work_private_t * pv = w->private_data;
194     int i;
195
196     if ( pv->busy & 1 )
197         SyncVideo( w );
198
199     for( i = 0; i < hb_list_count( pv->job->title->list_audio ); i++ )
200     {
201         if ( pv->busy & ( 1 << (i + 1) ) )
202             SyncAudio( w, i );
203     }
204
205     return ( pv->busy? HB_WORK_OK : HB_WORK_DONE );
206 }
207
208 hb_work_object_t hb_sync =
209 {
210     WORK_SYNC,
211     "Synchronization",
212     syncInit,
213     syncWork,
214     syncClose
215 };
216
217 static void InitAudio( hb_work_object_t * w, int i )
218 {
219     hb_work_private_t * pv = w->private_data;
220     hb_job_t        * job   = pv->job;
221     hb_title_t      * title = job->title;
222     hb_sync_audio_t * sync;
223
224     sync        = &pv->sync_audio[i];
225     sync->audio = hb_list_item( title->list_audio, i );
226
227     if( sync->audio->config.out.codec == HB_ACODEC_AC3 )
228     {
229         /* Have a silent AC-3 frame ready in case we have to fill a
230            gap */
231         AVCodec        * codec;
232         AVCodecContext * c;
233         short          * zeros;
234
235         codec = avcodec_find_encoder( CODEC_ID_AC3 );
236         c     = avcodec_alloc_context();
237
238         c->bit_rate    = sync->audio->config.in.bitrate;
239         c->sample_rate = sync->audio->config.in.samplerate;
240         c->channels    = HB_INPUT_CH_LAYOUT_GET_DISCRETE_COUNT( sync->audio->config.in.channel_layout );
241
242         if( hb_avcodec_open( c, codec ) < 0 )
243         {
244             hb_log( "sync: avcodec_open failed" );
245             return;
246         }
247
248         zeros          = calloc( AC3_SAMPLES_PER_FRAME *
249                                  sizeof( short ) * c->channels, 1 );
250         sync->ac3_size = sync->audio->config.in.bitrate * AC3_SAMPLES_PER_FRAME /
251                              sync->audio->config.in.samplerate / 8;
252         sync->ac3_buf  = malloc( sync->ac3_size );
253
254         if( avcodec_encode_audio( c, sync->ac3_buf, sync->ac3_size,
255                                   zeros ) != sync->ac3_size )
256         {
257             hb_log( "sync: avcodec_encode_audio failed" );
258         }
259
260         free( zeros );
261         hb_avcodec_close( c );
262         av_free( c );
263     }
264     else
265     {
266         /* Initialize libsamplerate */
267         int error;
268         sync->state             = src_new( SRC_SINC_MEDIUM_QUALITY, HB_AMIXDOWN_GET_DISCRETE_CHANNEL_COUNT(sync->audio->config.out.mixdown), &error );
269         sync->data.end_of_input = 0;
270     }
271 }
272
273 /***********************************************************************
274  * SyncVideo
275  ***********************************************************************
276  *
277  **********************************************************************/
278 static void SyncVideo( hb_work_object_t * w )
279 {
280     hb_work_private_t * pv = w->private_data;
281     hb_buffer_t * cur, * next, * sub = NULL;
282     hb_job_t * job = pv->job;
283     hb_subtitle_t *subtitle;
284     int i;
285
286     if( !pv->cur && !( pv->cur = hb_fifo_get( job->fifo_raw ) ) )
287     {
288         /* We haven't even got a frame yet */
289         return;
290     }
291     cur = pv->cur;
292     if( cur->size == 0 )
293     {
294         /* we got an end-of-stream. Feed it downstream & signal that we're done. */
295         hb_fifo_push( job->fifo_sync, hb_buffer_init( 0 ) );
296         pv->busy &=~ 1;
297         return;
298     }
299
300     /* At this point we have a frame to process. Let's check
301         1) if we will be able to push into the fifo ahead
302         2) if the next frame is there already, since we need it to
303            compute the duration of the current frame*/
304     while( !hb_fifo_is_full( job->fifo_sync ) &&
305            ( next = hb_fifo_see( job->fifo_raw ) ) )
306     {
307         hb_buffer_t * buf_tmp;
308
309         if( next->size == 0 )
310         {
311             /* we got an end-of-stream. Feed it downstream & signal that
312              * we're done. Note that this means we drop the final frame of
313              * video (we don't know its duration). On DVDs the final frame
314              * is often strange and dropping it seems to be a good idea. */
315             hb_fifo_push( job->fifo_sync, hb_buffer_init( 0 ) );
316             pv->busy &=~ 1;
317             return;
318         }
319         if( pv->pts_offset == INT64_MIN )
320         {
321             /* This is our first frame */
322             pv->pts_offset = 0;
323             if ( cur->start != 0 )
324             {
325                 /*
326                  * The first pts from a dvd should always be zero but
327                  * can be non-zero with a transport or program stream since
328                  * we're not guaranteed to start on an IDR frame. If we get
329                  * a non-zero initial PTS extend its duration so it behaves
330                  * as if it started at zero so that our audio timing will
331                  * be in sync.
332                  */
333                 hb_log( "sync: first pts is %lld", cur->start );
334                 cur->start = 0;
335             }
336         }
337
338         if( cur->new_chap ) {
339             hb_log("sync got new chapter %d", cur->new_chap );
340         }
341
342         /*
343          * since the first frame is always 0 and the upstream reader code
344          * is taking care of adjusting for pts discontinuities, we just have
345          * to deal with the next frame's start being in the past. This can
346          * happen when the PTS is adjusted after data loss but video frame
347          * reordering causes some frames with the old clock to appear after
348          * the clock change. This creates frames that overlap in time which
349          * looks to us like time going backward. The downstream muxing code
350          * can deal with overlaps of up to a frame time but anything larger
351          * we handle by dropping frames here.
352          */
353         if ( (int64_t)( next->start - cur->start ) <= 0 ||
354              (int64_t)( (cur->start - pv->audio_passthru_slip ) - pv->next_pts ) < 0 )
355         {
356             if ( pv->first_drop == 0 )
357             {
358                 pv->first_drop = next->start;
359             }
360             ++pv->drop_count;
361             buf_tmp = hb_fifo_get( job->fifo_raw );
362             if ( buf_tmp->new_chap )
363             {
364                 // don't drop a chapter mark when we drop the buffer
365                 pv->chap_mark = buf_tmp->new_chap;
366             }
367             hb_buffer_close( &buf_tmp );
368             continue;
369         }
370         if ( pv->first_drop )
371         {
372             hb_log( "sync: video time didn't advance - dropped %d frames "
373                     "(delta %d ms, current %lld, next %lld, dur %d)",
374                     pv->drop_count, (int)( cur->start - pv->first_drop ) / 90,
375                     cur->start, next->start, (int)( next->start - cur->start ) );
376             pv->first_drop = 0;
377             pv->drop_count = 0;
378         }
379
380         /*
381          * Track the video sequence number localy so that we can sync the audio
382          * to it using the sequence number as well as the PTS.
383          */
384         pv->video_sequence = cur->sequence;
385
386         /*
387          * Look for a subtitle for this frame.
388          *
389          * If found then it will be tagged onto a video buffer of the correct time and 
390          * sent in to the render pipeline. This only needs to be done for VOBSUBs which
391          * get rendered, other types of subtitles can just sit in their raw_queue until
392          * delt with at muxing.
393          */
394         for( i = 0; i < hb_list_count( job->list_subtitle ); i++)
395         {
396             subtitle = hb_list_item( job->list_subtitle, i );
397             if( subtitle->dest == RENDERSUB ) 
398             {
399                 hb_buffer_t * sub2;
400                 while( ( sub = hb_fifo_see( subtitle->fifo_raw ) ) )
401                 {
402                     /* If two subtitles overlap, make the first one stop
403                        when the second one starts */
404                     sub2 = hb_fifo_see2( subtitle->fifo_raw );
405                     if( sub2 && sub->stop > sub2->start )
406                         sub->stop = sub2->start;
407                     
408                     // hb_log("0x%x: video seq: %lld  subtitle sequence: %lld",
409                     //       sub, cur->sequence, sub->sequence);
410                     
411                     if( sub->sequence > cur->sequence )
412                     {
413                         /*
414                          * The video is behind where we are, so wait until
415                          * it catches up to the same reader point on the
416                          * DVD. Then our PTS should be in the same region
417                          * as the video.
418                          */
419                         sub = NULL;
420                         break;
421                     }
422                     
423                     if( sub->stop > cur->start ) {
424                         /*
425                          * The stop time is in the future, so fall through
426                          * and we'll deal with it in the next block of
427                          * code.
428                          */
429                         break;
430                     }
431                     
432                     /*
433                      * The subtitle is older than this picture, trash it
434                      */
435                     sub = hb_fifo_get( subtitle->fifo_raw );
436                     hb_buffer_close( &sub );
437                 }
438                 
439                 /*
440                  * There is a valid subtitle, is it time to display it?
441                  */
442                 if( sub )
443                 {
444                     if( sub->stop > sub->start)
445                     {
446                         /*
447                          * Normal subtitle which ends after it starts, check to
448                          * see that the current video is between the start and end.
449                          */
450                         if( cur->start > sub->start &&
451                             cur->start < sub->stop )
452                         {
453                             /*
454                              * We should be playing this, so leave the
455                              * subtitle in place.
456                              *
457                              * fall through to display
458                              */
459                             if( ( sub->stop - sub->start ) < ( 3 * 90000 ) )
460                             {
461                                 /*
462                                  * Subtitle is on for less than three seconds, extend
463                                  * the time that it is displayed to make it easier
464                                  * to read. Make it 3 seconds or until the next
465                                  * subtitle is displayed.
466                                  *
467                                  * This is in response to Indochine which only
468                                  * displays subs for 1 second - too fast to read.
469                                  */
470                                 sub->stop = sub->start + ( 3 * 90000 );
471                                 
472                                 sub2 = hb_fifo_see2( subtitle->fifo_raw );
473                                 
474                                 if( sub2 && sub->stop > sub2->start )
475                                 {
476                                     sub->stop = sub2->start;
477                                 }
478                             }
479                         }
480                         else
481                         {
482                             /*
483                              * Defer until the play point is within the subtitle
484                              */
485                             sub = NULL;
486                         }
487                     }
488                     else
489                     {
490                         /*
491                          * The end of the subtitle is less than the start, this is a
492                          * sign of a PTS discontinuity.
493                          */
494                         if( sub->start > cur->start )
495                         {
496                             /*
497                              * we haven't reached the start time yet, or
498                              * we have jumped backwards after having
499                              * already started this subtitle.
500                              */
501                             if( cur->start < sub->stop )
502                             {
503                                 /*
504                                  * We have jumped backwards and so should
505                                  * continue displaying this subtitle.
506                                  *
507                                  * fall through to display.
508                                  */
509                             }
510                             else
511                             {
512                                 /*
513                                  * Defer until the play point is within the subtitle
514                                  */
515                                 sub = NULL;
516                             }
517                         } else {
518                             /*
519                              * Play this subtitle as the start is greater than our
520                              * video point.
521                              *
522                              * fall through to display/
523                              */
524                         }
525                     }
526                 }
527             }
528             if( sub )
529             {
530                 /*
531                  * Don't overwrite the current sub, we'll check the
532                  * other subtitle streams on the next video buffer. 
533                  *
534                  * It doesn't make much sense having multiple rendered
535                  * subtitle tracks anyway.
536                  */
537                 break;
538             }
539         } // end subtitles
540
541         /*
542          * Adjust the pts of the current frame so that it's contiguous
543          * with the previous frame. The start time of the current frame
544          * has to be the end time of the previous frame and the stop
545          * time has to be the start of the next frame.  We don't
546          * make any adjustments to the source timestamps other than removing
547          * the clock offsets (which also removes pts discontinuities).
548          * This means we automatically encode at the source's frame rate.
549          * MP2 uses an implicit duration (frames end when the next frame
550          * starts) but more advanced containers like MP4 use an explicit
551          * duration. Since we're looking ahead one frame we set the
552          * explicit stop time from the start time of the next frame.
553          */
554         buf_tmp = cur;
555         pv->cur = cur = hb_fifo_get( job->fifo_raw );
556         pv->next_pts = cur->start;
557         int64_t duration = cur->start - buf_tmp->start;
558         if ( duration <= 0 )
559         {
560             hb_log( "sync: invalid video duration %lld, start %lld, next %lld",
561                     duration, buf_tmp->start, next->start );
562         }
563
564         buf_tmp->start = pv->next_start;
565         pv->next_start += duration;
566         buf_tmp->stop = pv->next_start;
567
568         if ( pv->chap_mark )
569         {
570             // we have a pending chapter mark from a recent drop - put it on this
571             // buffer (this may make it one frame late but we can't do any better).
572             buf_tmp->new_chap = pv->chap_mark;
573             pv->chap_mark = 0;
574         }
575
576         /* If we have a subtitle for this picture, copy it */
577         /* FIXME: we should avoid this memcpy */
578         if( sub )
579         {
580             buf_tmp->sub         = hb_buffer_init( sub->size );
581             buf_tmp->sub->x      = sub->x;
582             buf_tmp->sub->y      = sub->y;
583             buf_tmp->sub->width  = sub->width;
584             buf_tmp->sub->height = sub->height;
585             memcpy( buf_tmp->sub->data, sub->data, sub->size );
586         }
587
588         /* Push the frame to the renderer */
589         hb_fifo_push( job->fifo_sync, buf_tmp );
590
591         /* Update UI */
592         UpdateState( w );
593         
594         if( job->frame_to_stop && pv->count_frames > job->frame_to_stop )
595         {
596             // Drop an empty buffer into our output to ensure that things
597             // get flushed all the way out.
598             hb_fifo_push( job->fifo_sync, hb_buffer_init( 0 ) );
599             pv->busy &=~ 1;
600             hb_log( "sync: reached %d frames, exiting early (%i busy)",
601                     pv->count_frames, pv->busy );
602             return;
603         }
604
605         /* Make sure we won't get more frames then expected */
606         if( pv->count_frames >= pv->count_frames_max * 2)
607         {
608             hb_log( "sync: got too many frames (%d), exiting early",
609                     pv->count_frames );
610
611             // Drop an empty buffer into our output to ensure that things
612             // get flushed all the way out.
613             hb_fifo_push( job->fifo_sync, hb_buffer_init( 0 ) );
614             pv->busy &=~ 1;
615             return;
616         }
617     }
618 }
619
620 static void OutputAudioFrame( hb_job_t *job, hb_audio_t *audio, hb_buffer_t *buf,
621                               hb_sync_audio_t *sync, hb_fifo_t *fifo, int i )
622 {
623     int64_t start = sync->next_start;
624     int64_t duration = buf->stop - buf->start;
625
626     sync->next_pts += duration;
627
628     if( audio->config.in.samplerate == audio->config.out.samplerate ||
629         audio->config.out.codec == HB_ACODEC_AC3 ||
630         audio->config.out.codec == HB_ACODEC_DCA )
631     {
632         /*
633          * If we don't have to do sample rate conversion or this audio is 
634          * pass-thru just send the input buffer downstream after adjusting
635          * its timestamps to make the output stream continuous.
636          */
637     }
638     else
639     {
640         /* Not pass-thru - do sample rate conversion */
641         int count_in, count_out;
642         hb_buffer_t * buf_raw = buf;
643         int channel_count = HB_AMIXDOWN_GET_DISCRETE_CHANNEL_COUNT(audio->config.out.mixdown) *
644                             sizeof( float );
645
646         count_in  = buf_raw->size / channel_count;
647         /*
648          * When using stupid rates like 44.1 there will always be some
649          * truncation error. E.g., a 1536 sample AC3 frame will turn into a
650          * 1536*44.1/48.0 = 1411.2 sample frame. If we just truncate the .2
651          * the error will build up over time and eventually the audio will
652          * substantially lag the video. libsamplerate will keep track of the
653          * fractional sample & give it to us when appropriate if we give it
654          * an extra sample of space in the output buffer.
655          */
656         count_out = ( duration * audio->config.out.samplerate ) / 90000 + 1;
657
658         sync->data.input_frames = count_in;
659         sync->data.output_frames = count_out;
660         sync->data.src_ratio = (double)audio->config.out.samplerate /
661                                (double)audio->config.in.samplerate;
662
663         buf = hb_buffer_init( count_out * channel_count );
664         sync->data.data_in  = (float *) buf_raw->data;
665         sync->data.data_out = (float *) buf->data;
666         if( src_process( sync->state, &sync->data ) )
667         {
668             /* XXX If this happens, we're screwed */
669             hb_log( "sync: audio %d src_process failed", i );
670         }
671         hb_buffer_close( &buf_raw );
672
673         buf->size = sync->data.output_frames_gen * channel_count;
674         duration = ( sync->data.output_frames_gen * 90000 ) /
675                    audio->config.out.samplerate;
676     }
677     buf->frametype = HB_FRAME_AUDIO;
678     buf->start = start;
679     buf->stop  = start + duration;
680     sync->next_start = start + duration;
681     hb_fifo_push( fifo, buf );
682 }
683
684 /***********************************************************************
685  * SyncAudio
686  ***********************************************************************
687  *
688  **********************************************************************/
689 static void SyncAudio( hb_work_object_t * w, int i )
690 {
691     hb_work_private_t * pv = w->private_data;
692     hb_job_t        * job = pv->job;
693     hb_sync_audio_t * sync = &pv->sync_audio[i];
694     hb_audio_t      * audio = sync->audio;
695     hb_buffer_t     * buf;
696     hb_fifo_t       * fifo;
697     int64_t start;
698
699     if( audio->config.out.codec == HB_ACODEC_AC3 ||
700         audio->config.out.codec == HB_ACODEC_DCA )
701     {
702         fifo = audio->priv.fifo_out;
703     }
704     else
705     {
706         fifo = audio->priv.fifo_sync;
707     }
708
709     while( !hb_fifo_is_full( fifo ) && ( buf = hb_fifo_see( audio->priv.fifo_raw ) ) )
710     {
711         start = buf->start - pv->audio_passthru_slip;
712         /* if the next buffer is an eof send it downstream */
713         if ( buf->size <= 0 )
714         {
715             buf = hb_fifo_get( audio->priv.fifo_raw );
716             hb_fifo_push( fifo, buf );
717             pv->busy &=~ (1 << (i + 1) );
718             return;
719         }
720         if( job->frame_to_stop && pv->count_frames >= job->frame_to_stop )
721         {
722             hb_fifo_push( fifo, hb_buffer_init(0) );
723             pv->busy &=~ (1 << (i + 1) );
724             return;
725         }
726         if ( (int64_t)( start - sync->next_pts ) < 0 )
727         {
728             // audio time went backwards.
729             // If our output clock is more than a half frame ahead of the
730             // input clock drop this frame to move closer to sync.
731             // Otherwise drop frames until the input clock matches the output clock.
732             if ( sync->first_drop || sync->next_start - start > 90*15 )
733             {
734                 // Discard data that's in the past.
735                 if ( sync->first_drop == 0 )
736                 {
737                     sync->first_drop = sync->next_pts;
738                 }
739                 ++sync->drop_count;
740                 buf = hb_fifo_get( audio->priv.fifo_raw );
741                 hb_buffer_close( &buf );
742                 continue;
743             }
744             sync->next_pts = start;
745         }
746         if ( sync->first_drop )
747         {
748             // we were dropping old data but input buf time is now current
749             hb_log( "sync: audio %d time went backwards %d ms, dropped %d frames "
750                     "(next %lld, current %lld)", i,
751                     (int)( sync->next_pts - sync->first_drop ) / 90,
752                     sync->drop_count, sync->first_drop, sync->next_pts );
753             sync->first_drop = 0;
754             sync->drop_count = 0;
755             sync->next_pts = start;
756         }
757         if ( start - sync->next_pts >= (90 * 70) )
758         {
759             if ( start - sync->next_pts > (90000LL * 60) )
760             {
761                 // there's a gap of more than a minute between the last
762                 // frame and this. assume we got a corrupted timestamp
763                 // and just drop the next buf.
764                 hb_log( "sync: %d minute time gap in audio %d - dropping buf"
765                         "  start %lld, next %lld",
766                         (int)((start - sync->next_pts) / (90000*60)),
767                         i, start, sync->next_pts );
768                 buf = hb_fifo_get( audio->priv.fifo_raw );
769                 hb_buffer_close( &buf );
770                 continue;
771             }
772             /*
773              * there's a gap of at least 70ms between the last
774              * frame we processed & the next. Fill it with silence.
775              * Or in the case of DCA, skip some frames from the
776              * other streams.
777              */
778             if( sync->audio->config.out.codec == HB_ACODEC_DCA )
779             {
780                 hb_log( "sync: audio gap %d ms. Skipping frames. Audio %d"
781                         "  start %lld, next %lld",
782                         (int)((start - sync->next_pts) / 90),
783                         i, start, sync->next_pts );
784                 pv->audio_passthru_slip += (start - sync->next_pts);
785                 return;
786             }
787             hb_log( "sync: adding %d ms of silence to audio %d"
788                     "  start %lld, next %lld",
789                     (int)((start - sync->next_pts) / 90),
790                     i, start, sync->next_pts );
791             InsertSilence( w, i, start - sync->next_pts );
792             return;
793         }
794
795         /*
796          * When we get here we've taken care of all the dups and gaps in the
797          * audio stream and are ready to inject the next input frame into
798          * the output stream.
799          */
800         buf = hb_fifo_get( audio->priv.fifo_raw );
801         OutputAudioFrame( job, audio, buf, sync, fifo, i );
802     }
803 }
804
805 static void InsertSilence( hb_work_object_t * w, int i, int64_t duration )
806 {
807     hb_work_private_t * pv = w->private_data;
808     hb_job_t        *job = pv->job;
809     hb_sync_audio_t *sync = &pv->sync_audio[i];
810     hb_buffer_t     *buf;
811     hb_fifo_t       *fifo;
812
813     // to keep pass-thru and regular audio in sync we generate silence in
814     // AC3 frame-sized units. If the silence duration isn't an integer multiple
815     // of the AC3 frame duration we will truncate or round up depending on
816     // which minimizes the timing error.
817     const int frame_dur = ( 90000 * AC3_SAMPLES_PER_FRAME ) /
818                           sync->audio->config.in.samplerate;
819     int frame_count = ( duration + (frame_dur >> 1) ) / frame_dur;
820
821     while ( --frame_count >= 0 )
822     {
823         if( sync->audio->config.out.codec == HB_ACODEC_AC3 )
824         {
825             buf        = hb_buffer_init( sync->ac3_size );
826             buf->start = sync->next_pts;
827             buf->stop  = buf->start + frame_dur;
828             memcpy( buf->data, sync->ac3_buf, buf->size );
829             fifo = sync->audio->priv.fifo_out;
830         }
831         else
832         {
833             buf = hb_buffer_init( AC3_SAMPLES_PER_FRAME * sizeof( float ) *
834                                      HB_AMIXDOWN_GET_DISCRETE_CHANNEL_COUNT(
835                                          sync->audio->config.out.mixdown) );
836             buf->start = sync->next_pts;
837             buf->stop  = buf->start + frame_dur;
838             memset( buf->data, 0, buf->size );
839             fifo = sync->audio->priv.fifo_sync;
840         }
841         OutputAudioFrame( job, sync->audio, buf, sync, fifo, i );
842     }
843 }
844
845 static void UpdateState( hb_work_object_t * w )
846 {
847     hb_work_private_t * pv = w->private_data;
848     hb_state_t state;
849
850     if( !pv->count_frames )
851     {
852         pv->st_first = hb_get_date();
853     }
854     pv->count_frames++;
855
856     if( hb_get_date() > pv->st_dates[3] + 1000 )
857     {
858         memmove( &pv->st_dates[0], &pv->st_dates[1],
859                  3 * sizeof( uint64_t ) );
860         memmove( &pv->st_counts[0], &pv->st_counts[1],
861                  3 * sizeof( uint64_t ) );
862         pv->st_dates[3]  = hb_get_date();
863         pv->st_counts[3] = pv->count_frames;
864     }
865
866 #define p state.param.working
867     state.state = HB_STATE_WORKING;
868     p.progress  = (float) pv->count_frames / (float) pv->count_frames_max;
869     if( p.progress > 1.0 )
870     {
871         p.progress = 1.0;
872     }
873     p.rate_cur   = 1000.0 *
874         (float) ( pv->st_counts[3] - pv->st_counts[0] ) /
875         (float) ( pv->st_dates[3] - pv->st_dates[0] );
876     if( hb_get_date() > pv->st_first + 4000 )
877     {
878         int eta;
879         p.rate_avg = 1000.0 * (float) pv->st_counts[3] /
880             (float) ( pv->st_dates[3] - pv->st_first );
881         eta = (float) ( pv->count_frames_max - pv->st_counts[3] ) /
882             p.rate_avg;
883         p.hours   = eta / 3600;
884         p.minutes = ( eta % 3600 ) / 60;
885         p.seconds = eta % 60;
886     }
887     else
888     {
889         p.rate_avg = 0.0;
890         p.hours    = -1;
891         p.minutes  = -1;
892         p.seconds  = -1;
893     }
894 #undef p
895
896     hb_set_state( pv->job->h, &state );
897 }