美文网首页
FFmpeg中重要结构体的介绍

FFmpeg中重要结构体的介绍

作者: remax1 | 来源:发表于2020-06-18 09:58 被阅读0次

    关于FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用 LGPL 或 GPL 许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的 音频/视频编解码库 libavcodec,为了保证高可移植性和编解码质量, libavcodec 里很多 code 都是 从头开发的。libavformat,用于各种音视频封装格式的生成和解析。libavfilter,音视频滤波器的开发,例如水印。libpostproc,用于后期效果处理。

    结构体一 AVPacket

    AVPacket是FFmpeg中很重要的一个数据结构,它保存了解复用(demuxer)之后,解码 (decode)之前的数据(仍然是压缩后的数据)和关于这些数据的一些附加的信息,如显示时间 戳(pts),解码时间戳(dts),数据时长(duration),所在流媒体的索引(stream_index)等 等。

    typedef struct AVPacket {
        AVBufferRef *buf;//用来管理data指针引用的数据缓存
         int64_t pts;//显示时间,AVStream->time_base转换成时间戳
        int64_t dts;//解码时间,
        uint8_t *data;
        int   size;//data的大小
        int   stream_index;packet在stream的index位置 
        int   flags;//
        AVPacketSideData *side_data;//容器提供的一些附加数据
        int side_data_elems;//边缘数据元数个数
        int64_t duration;////数据的时长
        int64_t pos;//数据在流媒体中的位置                          
    #if FF_API_CONVERGENCE_DURATION
        attribute_deprecated
        int64_t convergence_duration;//不再使用
    }AVPacket;
    

    结构体二 AVFrame

    AVFrame中存储的是经过解码后的原始数据。在解码中,AVFrame是解码器的输出;在编码 中,AVFrame是编码器的输入。

    typedef struct AVFrame {
        uint8_t *data[AV_NUM_DATA_POINTERS];//存储原始帧数据(未编码的原始图像或音频格式,作为解码器的输出或编码器的输入)
      /**
      对于视频来说,linesize是每行图像的大小(字节数)。注意有对齐要求。
      对于音频来说,linesize是每个plane的大小(字节数)。音频只使用linesize[0]。对于planar音频来  说,每个plane的大小必须一样。
    **/
        int linesize[AV_NUM_DATA_POINTERS];
        uint8_t **extended_data;//对于视频来说,直接指向data[]成员。
        int width, height;//视频帧宽和高(像素)。
        int nb_samples;//音频帧中单个声道中包含的采样点数。
        int format;//帧格式。如果是未知格式或未设置,则值为-1。
    对于视频帧,此值对应于“enum AVPixelFormat”结构
        int key_frame;//视频帧是否是关键帧的标识,1->关键帧,0->非关键帧
        enum AVPictureType pict_type;//视频帧类型(I、B、P等)
        AVRational sample_aspect_ratio;//视频帧的宽高比。
        int64_t pts;//显示时间戳。单位是time_base
        ......
    } AVFrame;
    

    结构体三AVFormatContext

    在使用 FFmpeg 进行开发的时候,AVFormatContext 是一个贯穿始终的数据结构,很多函数 都要用到它作为参数。它是 FFmpeg 解封装(flv,mp4,rmvb,avi)功能的结构体,即媒体文件的构成和基本信息上下文。

        struct AVInputFormat *iformat; //输入数据的封装格式 
        AVIOContext *pb; //输入数据的缓存
        unsigned int nb_streams; //视音频流的个数
        AVStream **streams; //视音频流 
        char filename[1024]; //文件名 
        int64_t duration; //时长(单位:微秒ms,转换为秒需要除以1_000_000) 
    AVDictionary *metadata; //元数据
    

    结构体四AVCodecContext

    解码信息上下文

        enum AVMediaType codec_type; //编解码器的类型(视频,音频...) 
        struct AVCodec  *codec; //采用的解码器AVCodec(H.264,MPEG2...) 
        AVRational time_base; //根据该参数,可以把PTS转化为实际的时间
        int width, height; //如果是视频的话,代表宽和高 
        int sample_rate; //采样率(音频) 
        int channels; //声道数(音频)
        enum AVSampleFormat sample_fmt; //采样格式 
    

    联系

    参考:https://blog.csdn.net/leixiaohua1020/article/details/11693997
    解封装(flv,avi,rmvb,mp4)
    AVFormatContext主要存储视音频封装格式中包含的信息;AVInputFormat存储输入视音频使用的封装格式。每种视音频封装格式都对应一个AVInputFormat 结构。

    解码(h264,mpeg2,aac,mp3)
    每个AVStream存储一个视频/音频流的相关数据;每个AVStream对应一个AVCodecContext,存储该视频/音频流使用解码方式的相关数据;每个AVCodecContext中对应一个AVCodec,包含该视频/音频对应的解码器。每种解码器都对应一个AVCodec结构。

    存数据
    视频的话,每个结构一般是存一帧;音频可能有好几帧
    解码前数据:AVPacket
    解码后数据:AVFrame

    相关文章

      网友评论

          本文标题:FFmpeg中重要结构体的介绍

          本文链接:https://www.haomeiwen.com/subject/sbwsxktx.html