OSDN Git Service

rtpdec: Support sending RTCP feedback packets
[android-x86/external-ffmpeg.git] / libavformat / rtpdec.c
1 /*
2  * RTP input format
3  * Copyright (c) 2002 Fabrice Bellard
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavutil/mathematics.h"
23 #include "libavutil/avstring.h"
24 #include "libavutil/time.h"
25 #include "libavcodec/get_bits.h"
26 #include "avformat.h"
27 #include "mpegts.h"
28 #include "network.h"
29 #include "url.h"
30 #include "rtpdec.h"
31 #include "rtpdec_formats.h"
32
33 #define MIN_FEEDBACK_INTERVAL 200000 /* 200 ms in us */
34
35 static RTPDynamicProtocolHandler realmedia_mp3_dynamic_handler = {
36     .enc_name   = "X-MP3-draft-00",
37     .codec_type = AVMEDIA_TYPE_AUDIO,
38     .codec_id   = AV_CODEC_ID_MP3ADU,
39 };
40
41 static RTPDynamicProtocolHandler speex_dynamic_handler = {
42     .enc_name   = "speex",
43     .codec_type = AVMEDIA_TYPE_AUDIO,
44     .codec_id   = AV_CODEC_ID_SPEEX,
45 };
46
47 static RTPDynamicProtocolHandler opus_dynamic_handler = {
48     .enc_name   = "opus",
49     .codec_type = AVMEDIA_TYPE_AUDIO,
50     .codec_id   = AV_CODEC_ID_OPUS,
51 };
52
53 /* statistics functions */
54 static RTPDynamicProtocolHandler *rtp_first_dynamic_payload_handler = NULL;
55
56 void ff_register_dynamic_payload_handler(RTPDynamicProtocolHandler *handler)
57 {
58     handler->next = rtp_first_dynamic_payload_handler;
59     rtp_first_dynamic_payload_handler = handler;
60 }
61
62 void av_register_rtp_dynamic_payload_handlers(void)
63 {
64     ff_register_dynamic_payload_handler(&ff_mp4v_es_dynamic_handler);
65     ff_register_dynamic_payload_handler(&ff_mpeg4_generic_dynamic_handler);
66     ff_register_dynamic_payload_handler(&ff_amr_nb_dynamic_handler);
67     ff_register_dynamic_payload_handler(&ff_amr_wb_dynamic_handler);
68     ff_register_dynamic_payload_handler(&ff_h263_1998_dynamic_handler);
69     ff_register_dynamic_payload_handler(&ff_h263_2000_dynamic_handler);
70     ff_register_dynamic_payload_handler(&ff_h263_rfc2190_dynamic_handler);
71     ff_register_dynamic_payload_handler(&ff_h264_dynamic_handler);
72     ff_register_dynamic_payload_handler(&ff_ilbc_dynamic_handler);
73     ff_register_dynamic_payload_handler(&ff_jpeg_dynamic_handler);
74     ff_register_dynamic_payload_handler(&ff_vorbis_dynamic_handler);
75     ff_register_dynamic_payload_handler(&ff_theora_dynamic_handler);
76     ff_register_dynamic_payload_handler(&ff_qdm2_dynamic_handler);
77     ff_register_dynamic_payload_handler(&ff_svq3_dynamic_handler);
78     ff_register_dynamic_payload_handler(&ff_mp4a_latm_dynamic_handler);
79     ff_register_dynamic_payload_handler(&ff_vp8_dynamic_handler);
80     ff_register_dynamic_payload_handler(&ff_qcelp_dynamic_handler);
81     ff_register_dynamic_payload_handler(&realmedia_mp3_dynamic_handler);
82     ff_register_dynamic_payload_handler(&speex_dynamic_handler);
83     ff_register_dynamic_payload_handler(&opus_dynamic_handler);
84
85     ff_register_dynamic_payload_handler(&ff_ms_rtp_asf_pfv_handler);
86     ff_register_dynamic_payload_handler(&ff_ms_rtp_asf_pfa_handler);
87
88     ff_register_dynamic_payload_handler(&ff_qt_rtp_aud_handler);
89     ff_register_dynamic_payload_handler(&ff_qt_rtp_vid_handler);
90     ff_register_dynamic_payload_handler(&ff_quicktime_rtp_aud_handler);
91     ff_register_dynamic_payload_handler(&ff_quicktime_rtp_vid_handler);
92
93     ff_register_dynamic_payload_handler(&ff_g726_16_dynamic_handler);
94     ff_register_dynamic_payload_handler(&ff_g726_24_dynamic_handler);
95     ff_register_dynamic_payload_handler(&ff_g726_32_dynamic_handler);
96     ff_register_dynamic_payload_handler(&ff_g726_40_dynamic_handler);
97 }
98
99 RTPDynamicProtocolHandler *ff_rtp_handler_find_by_name(const char *name,
100                                                        enum AVMediaType codec_type)
101 {
102     RTPDynamicProtocolHandler *handler;
103     for (handler = rtp_first_dynamic_payload_handler;
104          handler; handler = handler->next)
105         if (!av_strcasecmp(name, handler->enc_name) &&
106             codec_type == handler->codec_type)
107             return handler;
108     return NULL;
109 }
110
111 RTPDynamicProtocolHandler *ff_rtp_handler_find_by_id(int id,
112                                                      enum AVMediaType codec_type)
113 {
114     RTPDynamicProtocolHandler *handler;
115     for (handler = rtp_first_dynamic_payload_handler;
116          handler; handler = handler->next)
117         if (handler->static_payload_id && handler->static_payload_id == id &&
118             codec_type == handler->codec_type)
119             return handler;
120     return NULL;
121 }
122
123 static int rtcp_parse_packet(RTPDemuxContext *s, const unsigned char *buf,
124                              int len)
125 {
126     int payload_len;
127     while (len >= 4) {
128         payload_len = FFMIN(len, (AV_RB16(buf + 2) + 1) * 4);
129
130         switch (buf[1]) {
131         case RTCP_SR:
132             if (payload_len < 20) {
133                 av_log(NULL, AV_LOG_ERROR,
134                        "Invalid length for RTCP SR packet\n");
135                 return AVERROR_INVALIDDATA;
136             }
137
138             s->last_rtcp_ntp_time  = AV_RB64(buf + 8);
139             s->last_rtcp_timestamp = AV_RB32(buf + 16);
140             if (s->first_rtcp_ntp_time == AV_NOPTS_VALUE) {
141                 s->first_rtcp_ntp_time = s->last_rtcp_ntp_time;
142                 if (!s->base_timestamp)
143                     s->base_timestamp = s->last_rtcp_timestamp;
144                 s->rtcp_ts_offset = s->last_rtcp_timestamp - s->base_timestamp;
145             }
146
147             break;
148         case RTCP_BYE:
149             return -RTCP_BYE;
150         }
151
152         buf += payload_len;
153         len -= payload_len;
154     }
155     return -1;
156 }
157
158 #define RTP_SEQ_MOD (1 << 16)
159
160 static void rtp_init_statistics(RTPStatistics *s, uint16_t base_sequence)
161 {
162     memset(s, 0, sizeof(RTPStatistics));
163     s->max_seq   = base_sequence;
164     s->probation = 1;
165 }
166
167 /*
168  * Called whenever there is a large jump in sequence numbers,
169  * or when they get out of probation...
170  */
171 static void rtp_init_sequence(RTPStatistics *s, uint16_t seq)
172 {
173     s->max_seq        = seq;
174     s->cycles         = 0;
175     s->base_seq       = seq - 1;
176     s->bad_seq        = RTP_SEQ_MOD + 1;
177     s->received       = 0;
178     s->expected_prior = 0;
179     s->received_prior = 0;
180     s->jitter         = 0;
181     s->transit        = 0;
182 }
183
184 /* Returns 1 if we should handle this packet. */
185 static int rtp_valid_packet_in_sequence(RTPStatistics *s, uint16_t seq)
186 {
187     uint16_t udelta = seq - s->max_seq;
188     const int MAX_DROPOUT    = 3000;
189     const int MAX_MISORDER   = 100;
190     const int MIN_SEQUENTIAL = 2;
191
192     /* source not valid until MIN_SEQUENTIAL packets with sequence
193      * seq. numbers have been received */
194     if (s->probation) {
195         if (seq == s->max_seq + 1) {
196             s->probation--;
197             s->max_seq = seq;
198             if (s->probation == 0) {
199                 rtp_init_sequence(s, seq);
200                 s->received++;
201                 return 1;
202             }
203         } else {
204             s->probation = MIN_SEQUENTIAL - 1;
205             s->max_seq   = seq;
206         }
207     } else if (udelta < MAX_DROPOUT) {
208         // in order, with permissible gap
209         if (seq < s->max_seq) {
210             // sequence number wrapped; count another 64k cycles
211             s->cycles += RTP_SEQ_MOD;
212         }
213         s->max_seq = seq;
214     } else if (udelta <= RTP_SEQ_MOD - MAX_MISORDER) {
215         // sequence made a large jump...
216         if (seq == s->bad_seq) {
217             /* two sequential packets -- assume that the other side
218              * restarted without telling us; just resync. */
219             rtp_init_sequence(s, seq);
220         } else {
221             s->bad_seq = (seq + 1) & (RTP_SEQ_MOD - 1);
222             return 0;
223         }
224     } else {
225         // duplicate or reordered packet...
226     }
227     s->received++;
228     return 1;
229 }
230
231 int ff_rtp_check_and_send_back_rr(RTPDemuxContext *s, URLContext *fd,
232                                   AVIOContext *avio, int count)
233 {
234     AVIOContext *pb;
235     uint8_t *buf;
236     int len;
237     int rtcp_bytes;
238     RTPStatistics *stats = &s->statistics;
239     uint32_t lost;
240     uint32_t extended_max;
241     uint32_t expected_interval;
242     uint32_t received_interval;
243     uint32_t lost_interval;
244     uint32_t expected;
245     uint32_t fraction;
246     uint64_t ntp_time = s->last_rtcp_ntp_time; // TODO: Get local ntp time?
247
248     if ((!fd && !avio) || (count < 1))
249         return -1;
250
251     /* TODO: I think this is way too often; RFC 1889 has algorithm for this */
252     /* XXX: MPEG pts hardcoded. RTCP send every 0.5 seconds */
253     s->octet_count += count;
254     rtcp_bytes = ((s->octet_count - s->last_octet_count) * RTCP_TX_RATIO_NUM) /
255         RTCP_TX_RATIO_DEN;
256     rtcp_bytes /= 50; // mmu_man: that's enough for me... VLC sends much less btw !?
257     if (rtcp_bytes < 28)
258         return -1;
259     s->last_octet_count = s->octet_count;
260
261     if (!fd)
262         pb = avio;
263     else if (avio_open_dyn_buf(&pb) < 0)
264         return -1;
265
266     // Receiver Report
267     avio_w8(pb, (RTP_VERSION << 6) + 1); /* 1 report block */
268     avio_w8(pb, RTCP_RR);
269     avio_wb16(pb, 7); /* length in words - 1 */
270     // our own SSRC: we use the server's SSRC + 1 to avoid conflicts
271     avio_wb32(pb, s->ssrc + 1);
272     avio_wb32(pb, s->ssrc); // server SSRC
273     // some placeholders we should really fill...
274     // RFC 1889/p64
275     extended_max          = stats->cycles + stats->max_seq;
276     expected              = extended_max - stats->base_seq + 1;
277     lost                  = expected - stats->received;
278     lost                  = FFMIN(lost, 0xffffff); // clamp it since it's only 24 bits...
279     expected_interval     = expected - stats->expected_prior;
280     stats->expected_prior = expected;
281     received_interval     = stats->received - stats->received_prior;
282     stats->received_prior = stats->received;
283     lost_interval         = expected_interval - received_interval;
284     if (expected_interval == 0 || lost_interval <= 0)
285         fraction = 0;
286     else
287         fraction = (lost_interval << 8) / expected_interval;
288
289     fraction = (fraction << 24) | lost;
290
291     avio_wb32(pb, fraction); /* 8 bits of fraction, 24 bits of total packets lost */
292     avio_wb32(pb, extended_max); /* max sequence received */
293     avio_wb32(pb, stats->jitter >> 4); /* jitter */
294
295     if (s->last_rtcp_ntp_time == AV_NOPTS_VALUE) {
296         avio_wb32(pb, 0); /* last SR timestamp */
297         avio_wb32(pb, 0); /* delay since last SR */
298     } else {
299         uint32_t middle_32_bits   = s->last_rtcp_ntp_time >> 16; // this is valid, right? do we need to handle 64 bit values special?
300         uint32_t delay_since_last = ntp_time - s->last_rtcp_ntp_time;
301
302         avio_wb32(pb, middle_32_bits); /* last SR timestamp */
303         avio_wb32(pb, delay_since_last); /* delay since last SR */
304     }
305
306     // CNAME
307     avio_w8(pb, (RTP_VERSION << 6) + 1); /* 1 report block */
308     avio_w8(pb, RTCP_SDES);
309     len = strlen(s->hostname);
310     avio_wb16(pb, (6 + len + 3) / 4); /* length in words - 1 */
311     avio_wb32(pb, s->ssrc + 1);
312     avio_w8(pb, 0x01);
313     avio_w8(pb, len);
314     avio_write(pb, s->hostname, len);
315     // padding
316     for (len = (6 + len) % 4; len % 4; len++)
317         avio_w8(pb, 0);
318
319     avio_flush(pb);
320     if (!fd)
321         return 0;
322     len = avio_close_dyn_buf(pb, &buf);
323     if ((len > 0) && buf) {
324         int av_unused result;
325         av_dlog(s->ic, "sending %d bytes of RR\n", len);
326         result = ffurl_write(fd, buf, len);
327         av_dlog(s->ic, "result from ffurl_write: %d\n", result);
328         av_free(buf);
329     }
330     return 0;
331 }
332
333 void ff_rtp_send_punch_packets(URLContext *rtp_handle)
334 {
335     AVIOContext *pb;
336     uint8_t *buf;
337     int len;
338
339     /* Send a small RTP packet */
340     if (avio_open_dyn_buf(&pb) < 0)
341         return;
342
343     avio_w8(pb, (RTP_VERSION << 6));
344     avio_w8(pb, 0); /* Payload type */
345     avio_wb16(pb, 0); /* Seq */
346     avio_wb32(pb, 0); /* Timestamp */
347     avio_wb32(pb, 0); /* SSRC */
348
349     avio_flush(pb);
350     len = avio_close_dyn_buf(pb, &buf);
351     if ((len > 0) && buf)
352         ffurl_write(rtp_handle, buf, len);
353     av_free(buf);
354
355     /* Send a minimal RTCP RR */
356     if (avio_open_dyn_buf(&pb) < 0)
357         return;
358
359     avio_w8(pb, (RTP_VERSION << 6));
360     avio_w8(pb, RTCP_RR); /* receiver report */
361     avio_wb16(pb, 1); /* length in words - 1 */
362     avio_wb32(pb, 0); /* our own SSRC */
363
364     avio_flush(pb);
365     len = avio_close_dyn_buf(pb, &buf);
366     if ((len > 0) && buf)
367         ffurl_write(rtp_handle, buf, len);
368     av_free(buf);
369 }
370
371 static int find_missing_packets(RTPDemuxContext *s, uint16_t *first_missing,
372                                 uint16_t *missing_mask)
373 {
374     int i;
375     uint16_t next_seq = s->seq + 1;
376     RTPPacket *pkt = s->queue;
377
378     if (!pkt || pkt->seq == next_seq)
379         return 0;
380
381     *missing_mask = 0;
382     for (i = 1; i <= 16; i++) {
383         uint16_t missing_seq = next_seq + i;
384         while (pkt) {
385             int16_t diff = pkt->seq - missing_seq;
386             if (diff >= 0)
387                 break;
388             pkt = pkt->next;
389         }
390         if (!pkt)
391             break;
392         if (pkt->seq == missing_seq)
393             continue;
394         *missing_mask |= 1 << (i - 1);
395     }
396
397     *first_missing = next_seq;
398     return 1;
399 }
400
401 int ff_rtp_send_rtcp_feedback(RTPDemuxContext *s, URLContext *fd,
402                               AVIOContext *avio)
403 {
404     int len, need_keyframe, missing_packets;
405     AVIOContext *pb;
406     uint8_t *buf;
407     int64_t now;
408     uint16_t first_missing, missing_mask;
409
410     if (!fd && !avio)
411         return -1;
412
413     need_keyframe = s->handler && s->handler->need_keyframe &&
414                     s->handler->need_keyframe(s->dynamic_protocol_context);
415     missing_packets = find_missing_packets(s, &first_missing, &missing_mask);
416
417     if (!need_keyframe && !missing_packets)
418         return 0;
419
420     /* Send new feedback if enough time has elapsed since the last
421      * feedback packet. */
422
423     now = av_gettime();
424     if (s->last_feedback_time &&
425         (now - s->last_feedback_time) < MIN_FEEDBACK_INTERVAL)
426         return 0;
427     s->last_feedback_time = now;
428
429     if (!fd)
430         pb = avio;
431     else if (avio_open_dyn_buf(&pb) < 0)
432         return -1;
433
434     if (need_keyframe) {
435         avio_w8(pb, (RTP_VERSION << 6) | 1); /* PLI */
436         avio_w8(pb, RTCP_PSFB);
437         avio_wb16(pb, 2); /* length in words - 1 */
438         // our own SSRC: we use the server's SSRC + 1 to avoid conflicts
439         avio_wb32(pb, s->ssrc + 1);
440         avio_wb32(pb, s->ssrc); // server SSRC
441     }
442
443     if (missing_packets) {
444         avio_w8(pb, (RTP_VERSION << 6) | 1); /* NACK */
445         avio_w8(pb, RTCP_RTPFB);
446         avio_wb16(pb, 3); /* length in words - 1 */
447         avio_wb32(pb, s->ssrc + 1);
448         avio_wb32(pb, s->ssrc); // server SSRC
449
450         avio_wb16(pb, first_missing);
451         avio_wb16(pb, missing_mask);
452     }
453
454     avio_flush(pb);
455     if (!fd)
456         return 0;
457     len = avio_close_dyn_buf(pb, &buf);
458     if (len > 0 && buf) {
459         ffurl_write(fd, buf, len);
460         av_free(buf);
461     }
462     return 0;
463 }
464
465 /**
466  * open a new RTP parse context for stream 'st'. 'st' can be NULL for
467  * MPEG2-TS streams to indicate that they should be demuxed inside the
468  * rtp demux (otherwise AV_CODEC_ID_MPEG2TS packets are returned)
469  */
470 RTPDemuxContext *ff_rtp_parse_open(AVFormatContext *s1, AVStream *st,
471                                    int payload_type, int queue_size)
472 {
473     RTPDemuxContext *s;
474
475     s = av_mallocz(sizeof(RTPDemuxContext));
476     if (!s)
477         return NULL;
478     s->payload_type        = payload_type;
479     s->last_rtcp_ntp_time  = AV_NOPTS_VALUE;
480     s->first_rtcp_ntp_time = AV_NOPTS_VALUE;
481     s->ic                  = s1;
482     s->st                  = st;
483     s->queue_size          = queue_size;
484     rtp_init_statistics(&s->statistics, 0); // do we know the initial sequence from sdp?
485     if (!strcmp(ff_rtp_enc_name(payload_type), "MP2T")) {
486         s->ts = ff_mpegts_parse_open(s->ic);
487         if (s->ts == NULL) {
488             av_free(s);
489             return NULL;
490         }
491     } else if (st) {
492         switch (st->codec->codec_id) {
493         case AV_CODEC_ID_MPEG1VIDEO:
494         case AV_CODEC_ID_MPEG2VIDEO:
495         case AV_CODEC_ID_MP2:
496         case AV_CODEC_ID_MP3:
497         case AV_CODEC_ID_MPEG4:
498         case AV_CODEC_ID_H263:
499         case AV_CODEC_ID_H264:
500             st->need_parsing = AVSTREAM_PARSE_FULL;
501             break;
502         case AV_CODEC_ID_VORBIS:
503             st->need_parsing = AVSTREAM_PARSE_HEADERS;
504             break;
505         case AV_CODEC_ID_ADPCM_G722:
506             /* According to RFC 3551, the stream clock rate is 8000
507              * even if the sample rate is 16000. */
508             if (st->codec->sample_rate == 8000)
509                 st->codec->sample_rate = 16000;
510             break;
511         default:
512             break;
513         }
514     }
515     // needed to send back RTCP RR in RTSP sessions
516     gethostname(s->hostname, sizeof(s->hostname));
517     return s;
518 }
519
520 void ff_rtp_parse_set_dynamic_protocol(RTPDemuxContext *s, PayloadContext *ctx,
521                                        RTPDynamicProtocolHandler *handler)
522 {
523     s->dynamic_protocol_context = ctx;
524     s->handler                  = handler;
525 }
526
527 /**
528  * This was the second switch in rtp_parse packet.
529  * Normalizes time, if required, sets stream_index, etc.
530  */
531 static void finalize_packet(RTPDemuxContext *s, AVPacket *pkt, uint32_t timestamp)
532 {
533     if (pkt->pts != AV_NOPTS_VALUE || pkt->dts != AV_NOPTS_VALUE)
534         return; /* Timestamp already set by depacketizer */
535     if (timestamp == RTP_NOTS_VALUE)
536         return;
537
538     if (s->last_rtcp_ntp_time != AV_NOPTS_VALUE && s->ic->nb_streams > 1) {
539         int64_t addend;
540         int delta_timestamp;
541
542         /* compute pts from timestamp with received ntp_time */
543         delta_timestamp = timestamp - s->last_rtcp_timestamp;
544         /* convert to the PTS timebase */
545         addend = av_rescale(s->last_rtcp_ntp_time - s->first_rtcp_ntp_time,
546                             s->st->time_base.den,
547                             (uint64_t) s->st->time_base.num << 32);
548         pkt->pts = s->range_start_offset + s->rtcp_ts_offset + addend +
549                    delta_timestamp;
550         return;
551     }
552
553     if (!s->base_timestamp)
554         s->base_timestamp = timestamp;
555     /* assume that the difference is INT32_MIN < x < INT32_MAX,
556      * but allow the first timestamp to exceed INT32_MAX */
557     if (!s->timestamp)
558         s->unwrapped_timestamp += timestamp;
559     else
560         s->unwrapped_timestamp += (int32_t)(timestamp - s->timestamp);
561     s->timestamp = timestamp;
562     pkt->pts     = s->unwrapped_timestamp + s->range_start_offset -
563                    s->base_timestamp;
564 }
565
566 static int rtp_parse_packet_internal(RTPDemuxContext *s, AVPacket *pkt,
567                                      const uint8_t *buf, int len)
568 {
569     unsigned int ssrc, h;
570     int payload_type, seq, ret, flags = 0;
571     int ext;
572     AVStream *st;
573     uint32_t timestamp;
574     int rv = 0;
575
576     ext          = buf[0] & 0x10;
577     payload_type = buf[1] & 0x7f;
578     if (buf[1] & 0x80)
579         flags |= RTP_FLAG_MARKER;
580     seq       = AV_RB16(buf + 2);
581     timestamp = AV_RB32(buf + 4);
582     ssrc      = AV_RB32(buf + 8);
583     /* store the ssrc in the RTPDemuxContext */
584     s->ssrc = ssrc;
585
586     /* NOTE: we can handle only one payload type */
587     if (s->payload_type != payload_type)
588         return -1;
589
590     st = s->st;
591     // only do something with this if all the rtp checks pass...
592     if (!rtp_valid_packet_in_sequence(&s->statistics, seq)) {
593         av_log(st ? st->codec : NULL, AV_LOG_ERROR,
594                "RTP: PT=%02x: bad cseq %04x expected=%04x\n",
595                payload_type, seq, ((s->seq + 1) & 0xffff));
596         return -1;
597     }
598
599     if (buf[0] & 0x20) {
600         int padding = buf[len - 1];
601         if (len >= 12 + padding)
602             len -= padding;
603     }
604
605     s->seq = seq;
606     len   -= 12;
607     buf   += 12;
608
609     /* RFC 3550 Section 5.3.1 RTP Header Extension handling */
610     if (ext) {
611         if (len < 4)
612             return -1;
613         /* calculate the header extension length (stored as number
614          * of 32-bit words) */
615         ext = (AV_RB16(buf + 2) + 1) << 2;
616
617         if (len < ext)
618             return -1;
619         // skip past RTP header extension
620         len -= ext;
621         buf += ext;
622     }
623
624     if (!st) {
625         /* specific MPEG2-TS demux support */
626         ret = ff_mpegts_parse_packet(s->ts, pkt, buf, len);
627         /* The only error that can be returned from ff_mpegts_parse_packet
628          * is "no more data to return from the provided buffer", so return
629          * AVERROR(EAGAIN) for all errors */
630         if (ret < 0)
631             return AVERROR(EAGAIN);
632         if (ret < len) {
633             s->read_buf_size = FFMIN(len - ret, sizeof(s->buf));
634             memcpy(s->buf, buf + ret, s->read_buf_size);
635             s->read_buf_index = 0;
636             return 1;
637         }
638         return 0;
639     } else if (s->handler && s->handler->parse_packet) {
640         rv = s->handler->parse_packet(s->ic, s->dynamic_protocol_context,
641                                       s->st, pkt, &timestamp, buf, len, seq,
642                                       flags);
643     } else {
644         /* At this point, the RTP header has been stripped;
645          * This is ASSUMING that there is only 1 CSRC, which isn't wise. */
646         switch (st->codec->codec_id) {
647         case AV_CODEC_ID_MP2:
648         case AV_CODEC_ID_MP3:
649             /* better than nothing: skip MPEG audio RTP header */
650             if (len <= 4)
651                 return -1;
652             h    = AV_RB32(buf);
653             len -= 4;
654             buf += 4;
655             av_new_packet(pkt, len);
656             memcpy(pkt->data, buf, len);
657             break;
658         case AV_CODEC_ID_MPEG1VIDEO:
659         case AV_CODEC_ID_MPEG2VIDEO:
660             /* better than nothing: skip MPEG video RTP header */
661             if (len <= 4)
662                 return -1;
663             h    = AV_RB32(buf);
664             buf += 4;
665             len -= 4;
666             if (h & (1 << 26)) {
667                 /* MPEG-2 */
668                 if (len <= 4)
669                     return -1;
670                 buf += 4;
671                 len -= 4;
672             }
673             av_new_packet(pkt, len);
674             memcpy(pkt->data, buf, len);
675             break;
676         default:
677             av_new_packet(pkt, len);
678             memcpy(pkt->data, buf, len);
679             break;
680         }
681
682         pkt->stream_index = st->index;
683     }
684
685     // now perform timestamp things....
686     finalize_packet(s, pkt, timestamp);
687
688     return rv;
689 }
690
691 void ff_rtp_reset_packet_queue(RTPDemuxContext *s)
692 {
693     while (s->queue) {
694         RTPPacket *next = s->queue->next;
695         av_free(s->queue->buf);
696         av_free(s->queue);
697         s->queue = next;
698     }
699     s->seq       = 0;
700     s->queue_len = 0;
701     s->prev_ret  = 0;
702 }
703
704 static void enqueue_packet(RTPDemuxContext *s, uint8_t *buf, int len)
705 {
706     uint16_t seq   = AV_RB16(buf + 2);
707     RTPPacket *cur = s->queue, *prev = NULL, *packet;
708
709     /* Find the correct place in the queue to insert the packet */
710     while (cur) {
711         int16_t diff = seq - cur->seq;
712         if (diff < 0)
713             break;
714         prev = cur;
715         cur  = cur->next;
716     }
717
718     packet = av_mallocz(sizeof(*packet));
719     if (!packet)
720         return;
721     packet->recvtime = av_gettime();
722     packet->seq      = seq;
723     packet->len      = len;
724     packet->buf      = buf;
725     packet->next     = cur;
726     if (prev)
727         prev->next = packet;
728     else
729         s->queue = packet;
730     s->queue_len++;
731 }
732
733 static int has_next_packet(RTPDemuxContext *s)
734 {
735     return s->queue && s->queue->seq == (uint16_t) (s->seq + 1);
736 }
737
738 int64_t ff_rtp_queued_packet_time(RTPDemuxContext *s)
739 {
740     return s->queue ? s->queue->recvtime : 0;
741 }
742
743 static int rtp_parse_queued_packet(RTPDemuxContext *s, AVPacket *pkt)
744 {
745     int rv;
746     RTPPacket *next;
747
748     if (s->queue_len <= 0)
749         return -1;
750
751     if (!has_next_packet(s))
752         av_log(s->st ? s->st->codec : NULL, AV_LOG_WARNING,
753                "RTP: missed %d packets\n", s->queue->seq - s->seq - 1);
754
755     /* Parse the first packet in the queue, and dequeue it */
756     rv   = rtp_parse_packet_internal(s, pkt, s->queue->buf, s->queue->len);
757     next = s->queue->next;
758     av_free(s->queue->buf);
759     av_free(s->queue);
760     s->queue = next;
761     s->queue_len--;
762     return rv;
763 }
764
765 static int rtp_parse_one_packet(RTPDemuxContext *s, AVPacket *pkt,
766                                 uint8_t **bufptr, int len)
767 {
768     uint8_t *buf = bufptr ? *bufptr : NULL;
769     int ret, flags = 0;
770     uint32_t timestamp;
771     int rv = 0;
772
773     if (!buf) {
774         /* If parsing of the previous packet actually returned 0 or an error,
775          * there's nothing more to be parsed from that packet, but we may have
776          * indicated that we can return the next enqueued packet. */
777         if (s->prev_ret <= 0)
778             return rtp_parse_queued_packet(s, pkt);
779         /* return the next packets, if any */
780         if (s->st && s->handler && s->handler->parse_packet) {
781             /* timestamp should be overwritten by parse_packet, if not,
782              * the packet is left with pts == AV_NOPTS_VALUE */
783             timestamp = RTP_NOTS_VALUE;
784             rv        = s->handler->parse_packet(s->ic, s->dynamic_protocol_context,
785                                                  s->st, pkt, &timestamp, NULL, 0, 0,
786                                                  flags);
787             finalize_packet(s, pkt, timestamp);
788             return rv;
789         } else {
790             // TODO: Move to a dynamic packet handler (like above)
791             if (s->read_buf_index >= s->read_buf_size)
792                 return AVERROR(EAGAIN);
793             ret = ff_mpegts_parse_packet(s->ts, pkt, s->buf + s->read_buf_index,
794                                          s->read_buf_size - s->read_buf_index);
795             if (ret < 0)
796                 return AVERROR(EAGAIN);
797             s->read_buf_index += ret;
798             if (s->read_buf_index < s->read_buf_size)
799                 return 1;
800             else
801                 return 0;
802         }
803     }
804
805     if (len < 12)
806         return -1;
807
808     if ((buf[0] & 0xc0) != (RTP_VERSION << 6))
809         return -1;
810     if (RTP_PT_IS_RTCP(buf[1])) {
811         return rtcp_parse_packet(s, buf, len);
812     }
813
814     if ((s->seq == 0 && !s->queue) || s->queue_size <= 1) {
815         /* First packet, or no reordering */
816         return rtp_parse_packet_internal(s, pkt, buf, len);
817     } else {
818         uint16_t seq = AV_RB16(buf + 2);
819         int16_t diff = seq - s->seq;
820         if (diff < 0) {
821             /* Packet older than the previously emitted one, drop */
822             av_log(s->st ? s->st->codec : NULL, AV_LOG_WARNING,
823                    "RTP: dropping old packet received too late\n");
824             return -1;
825         } else if (diff <= 1) {
826             /* Correct packet */
827             rv = rtp_parse_packet_internal(s, pkt, buf, len);
828             return rv;
829         } else {
830             /* Still missing some packet, enqueue this one. */
831             enqueue_packet(s, buf, len);
832             *bufptr = NULL;
833             /* Return the first enqueued packet if the queue is full,
834              * even if we're missing something */
835             if (s->queue_len >= s->queue_size)
836                 return rtp_parse_queued_packet(s, pkt);
837             return -1;
838         }
839     }
840 }
841
842 /**
843  * Parse an RTP or RTCP packet directly sent as a buffer.
844  * @param s RTP parse context.
845  * @param pkt returned packet
846  * @param bufptr pointer to the input buffer or NULL to read the next packets
847  * @param len buffer len
848  * @return 0 if a packet is returned, 1 if a packet is returned and more can follow
849  * (use buf as NULL to read the next). -1 if no packet (error or no more packet).
850  */
851 int ff_rtp_parse_packet(RTPDemuxContext *s, AVPacket *pkt,
852                         uint8_t **bufptr, int len)
853 {
854     int rv = rtp_parse_one_packet(s, pkt, bufptr, len);
855     s->prev_ret = rv;
856     while (rv == AVERROR(EAGAIN) && has_next_packet(s))
857         rv = rtp_parse_queued_packet(s, pkt);
858     return rv ? rv : has_next_packet(s);
859 }
860
861 void ff_rtp_parse_close(RTPDemuxContext *s)
862 {
863     ff_rtp_reset_packet_queue(s);
864     if (!strcmp(ff_rtp_enc_name(s->payload_type), "MP2T")) {
865         ff_mpegts_parse_close(s->ts);
866     }
867     av_free(s);
868 }
869
870 int ff_parse_fmtp(AVStream *stream, PayloadContext *data, const char *p,
871                   int (*parse_fmtp)(AVStream *stream,
872                                     PayloadContext *data,
873                                     char *attr, char *value))
874 {
875     char attr[256];
876     char *value;
877     int res;
878     int value_size = strlen(p) + 1;
879
880     if (!(value = av_malloc(value_size))) {
881         av_log(NULL, AV_LOG_ERROR, "Failed to allocate data for FMTP.");
882         return AVERROR(ENOMEM);
883     }
884
885     // remove protocol identifier
886     while (*p && *p == ' ')
887         p++;                     // strip spaces
888     while (*p && *p != ' ')
889         p++;                     // eat protocol identifier
890     while (*p && *p == ' ')
891         p++;                     // strip trailing spaces
892
893     while (ff_rtsp_next_attr_and_value(&p,
894                                        attr, sizeof(attr),
895                                        value, value_size)) {
896         res = parse_fmtp(stream, data, attr, value);
897         if (res < 0 && res != AVERROR_PATCHWELCOME) {
898             av_free(value);
899             return res;
900         }
901     }
902     av_free(value);
903     return 0;
904 }
905
906 int ff_rtp_finalize_packet(AVPacket *pkt, AVIOContext **dyn_buf, int stream_idx)
907 {
908     av_init_packet(pkt);
909
910     pkt->size         = avio_close_dyn_buf(*dyn_buf, &pkt->data);
911     pkt->stream_index = stream_idx;
912     pkt->destruct     = av_destruct_packet;
913     *dyn_buf          = NULL;
914     return pkt->size;
915 }