FFmpeg 工具：音视频开发都用它，快@你兄弟来看丨音视频工具

毕加索《灯》像素版

（本文基本逻辑：ffmpeg 常用命令介绍 → ffplay 常用命令介绍 → ffprobe 常用命令介绍）

从事音视频开发的程序员几乎都应该知道或使用过 FFmpeg。FFmpeg 是一个开源软件，采用 LGPL 或 GPL 许可证（需要注意这里的开源协议，它具有『传染性』，会要求它的使用方也开源）。我们可以使用 FFmpeg 来进行多种格式音频和视频的录制、转换、流处理功能。

FFmpeg 由多个组件组成，包含了命令行应用程序以及一系列函数库：

命令行应用程序：
- ffmpeg：用于音视频的编解码、格式转换以及音视频流的内容处理。
- ffplay：基于 SDL 与 ffmpeg 库实现的一个播放器。
- ffprobe：音视频分析工具。
函数库：
- libavcodec：编解码库。
- libavformat：音视频容器格式以及所支持的协议的封装和解析。
- libavutil：提供了一些公共函数，工具库。
- libavfilter：音视频的滤镜库，如视频加水印、音频变声等。
- libavdevice：支持众多设备数据的输入与输出，如读取摄像头数据、屏幕录制。
- libswresample, libavresample：提供音频的重采样工具库。
- libswscale：提供对视频图像进行色彩转换、缩放以及像素格式转换，如图像的 YUV 转换。
- libpostproc：多媒体后处理器。

如果你使用 Mac 设备，在 Mac 上安装 FFmpeg 可以用 Homebrew：

代码语言：javascript复制

$ brew install ffmpeg

至于 Homebrew 的安装，以及使用它安装 ffmpeg 的相关细节，这里就不做过多探讨了。

本文主要介绍 FFmpeg 命令行应用程序的使用，这是我们在音视频开发中必不可少的工具。

1、ffmpeg 命令行工具

ffmpeg 是一个音视频编解码、格式转换以及音视频流内容处理的工具。

1.1、基础能力

通过下列命令可以查看当前 ffmpeg 工具所支持的能力：

代码语言：javascript复制

// 获取帮助
$ ffmpeg -help

// 支持的格式
$ ffmpeg -formats

// 支持的解码
$ ffmpeg -decoders

// 支持的编码
$ ffmpeg -encoders

// 支持的协议
$ ffmpeg -protocols

1.2、转封装

可以使用下列命令来转封装：

代码语言：javascript复制

$ ffmpeg -i <输入文件路径> -c copy -f <输出封装格式> <输入文件路径>

1）转 MP4

MP4 是当下短视频最常使用的封装格式，关于 MP4 格式更详细的介绍，参见《MP4 格式》。

FFmpeg 封装 MP4 常用参数：

示例：将 FLV 的文件转封装成 MP4 并将 moov box 移动到文件头部。

代码语言：javascript复制

$ ffmpeg -i input.flv -c copy -f mp4 -movflags faststart output.mp4

2）转 FLV

FLV 是当下实时直播最常使用的封装格式，关于 FLV 格式更详细的介绍，参见《FLV 格式》。

FFmpeg 封装 FLV 常用参数：

示例：将 MP4 的文件转封装成 FLV。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -c copy -f flv output.flv

FLV 封装中可以支持的音频编码和视频编码是有限的，在转封装的时候，如果音频或视频不符合标准时，会封装不了而报错。一般，我们可以在转封装的时候同时将音频和视频转码成 FLV 支持的格式。

示例：将 MP4 的文件转封装成 FLV 并确保音频转码为 AAC。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -vcodec copy -acodec aac -f flv output.flv

3）转 HLS

HLS 是当下直播回放和部分实时直播场景最常使用的协议，它对应的媒体格式是 M3U8 TS，关于 HLS 更详细的介绍，参见《HLS 协议》、《M3U8 格式》、《TS 格式》。

FFmpeg 封装 HLS 常用参数：

示例：将 MP4 的文件转封装成 HLS 直播。

代码语言：javascript复制

$ ffmpeg -re -i input.mp4 -c copy -f hls -bsf:v h264_mp4toannexb output.m3u8

因为默认是 HLS 直播，所以生成的 M3U8 文件内容会随着切片的产生而更新。这里多了一个 -bsf:v h264_mp4toannexb 参数，它的作用是将 MP4 中的 H.264 数据转换为 H.264 AnnexB 标准的编码，AnnexB 标准的编码常见于实时传输流中。如果源文件为 FLV、TS 等可作为直播传输流的视频，则不需要这个参数。

re：表示以本地帧率读数据。
bsf：表示 Binary Stream Filter。

4）音视频流抽取

FFmpeg 除了转封装、转码之外，还可以提取音频流和视频流。

示例：从 MP4 文件中提取 AAC 音频流。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -vn -acodec copy output.aac

vn：表示不包含视频。

示例：从 MP4 文件中提取 H.264 视频流。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -an -vcodec copy output.h264

an：表示不包含音频。

示例：从 MP4 文件中提取 H.265 视频流。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -an -vcodec copy -bsf hevc_mp4toannexb -f hevc output.hevc

1.3、转码

FFmpeg 一般使用 libx264 来进行软编码。下面是 x264 相关的编码参数：

1）Preset

示例：设置 preset 预设参数为 ultrafast 进行转码。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -vcodec libx264 -preset ultrafast -b:v 2000k output.mp4

b:v：表示视频输出码率。

2）Profile

示例：设置 profile 为 high 进行转码。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -vcodec libx264 -profile:v high -level 3.1 -s 720x1280 -an -y -t 10 output_high.ts

y：表示覆盖输出文件。
s：表示输出分辨率。

使用 main profile 和 high profile 编码出来的视频是可以包含 B 帧的，转码完后，可以看一下：

代码语言：javascript复制

$ ffprobe -v quiet -show_frames -select_streams v output_high.ts | grep "pict_type=B" | wc -l

3）GOP

示例：设置 GOP 为 50 帧，并且场景切换时不插入关键帧。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -c:v libx264 -g 50 -sc_threshold 0 -t 60 -y output.mp4

g：以帧为单位设置 GOP 大小。
sc_threshold：设定是否在场景切换时插入关键帧。0 表示不插入，1 表示插入。

4）B 帧

由于设置 x264 的参数比较多，所以 FFmpeg 开放了 x264opts 来设置 x264 内部的私有参数。

示例：设置 GOP 为 50 帧，并且场景切换时不插入关键帧，且不出现 B 帧。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -c:v libx264 -x264opts "bframes=0" -g 50 -sc_threshold 0 -t 60 -y output.mp4

示例：设置 GOP 为 50 帧，并且场景切换时不插入关键帧，且 2 个 P 帧之间存放 3 个 B 帧。

代码语言：javascript复制

$ ffmpeg -i input.mp4 -c:v libx264 -x264opts "bframes=3:b-adapt=0" -g 50 -sc_threshold 0 -t 60 -y output.mp4

5）码率

编码时能够设置 VBR、CBR 编码模式，VBR 表示可变码率，CBR 表示恒定码率。

示例：

代码语言：javascript复制

$ ffmpeg -i input.mp4 -c:v libx264 -x264opts "bframes=10:b-adapt=0" -b:v 1000k -maxrate 1000k -minrate 1000k -bufsize 50k -nal-hrd cbr -g 50 -sc_threshold 0 -t 60 -y output.ts

上面的命令比较复杂，分别做了这些事：

-x264opts "bframes=10:b-adapt=0"：设置 B 帧个数为 2 个 P 帧之间包含 10 个 B 帧。
-b:v 1000k：设置视频平均码率为 1000kbps。
-maxrate 1000k：设置视频最大码率为 1000kbps。
-minrate 1000k：设置视频最小码率为 1000kbps。
-bufsize 50k：设置编码的 buffer 大小为 50KB。
-nal-hrd cbr：设置 H.264 的编码 HRD 信号形式为 CBR。
-g 50：设置每 50 帧一个 GOP。
-sc_threshold 0：设置场景切换不插入关键帧。

1.4、流媒体

1）发布 RTMP 流

RTMP 是当下实时直播最常使用的推流协议，关于 RTMP 协议更详细的介绍，参见《RTMP 协议》。

FFmpeg 操作 RTMP 直播流使用的参数：

示例：本地 MP4 视频文件转封装为 FLV 后推流至指定 RTMP 流媒体服务器。

代码语言：javascript复制

$ ffmpeg -re -i input.mp4 -c copy -f flv rtmp://localhost:1935/live/room

2）录制 RTMP 流

示例：RTMP 媒体流保存为 FLV 视频文件。

代码语言：javascript复制

$ ffmpeg -i rtmp://localhost:1935/live/room -c copy output.flv

3）录制 HTTP 流

在流媒体服务中，HTTP 服务是最为常见的，尤其是点播。直播也是可以的，包括 HTTP-FLV、HTTP-TS、HLS。

FFmpeg 操作 HTTP 使用的参数：

示例：拉取并录制 FLV 直播流。

代码语言：javascript复制

$ ffmpeg -i http://www.abc.com/live.flv -c copy -f flv output.flv

示例：拉取 TS 直播流流录制为 FLV。

代码语言：javascript复制

$ ffmpeg -i http://www.abc.com/live.ts -c copy -f flv output.flv

示例：拉取 HLS 直播流流录制为 FLV。

代码语言：javascript复制

$ ffmpeg -i http://www.abc.com/live.m3u8 -c copy -f flv output.flv

2、ffplay 命令行工具

ffplay 是基于 SDL 与 ffmpeg 库实现的一个播放器，可以使用它来播放原始的 YUV/PCM 数据、编码后的 H.264/H.265 等数据，封装好的 MP4/M4A 等数据，或是流媒体数据。

1）播放原始声音数据

代码语言：javascript复制

$ ffplay -f <格式名> -ac <声道数> -ar <采样率> -i <文件路径>

其中，-f 表示 PCM 格式，可以用 ffmpeg -formats | grep PCM 命令查看当前支持的格式。

示例：

代码语言：javascript复制

$ ffplay -f f32le -ac 1 -ar 48000 -i input.pcm

2）播放原始图像数据

代码语言：javascript复制

$ ffplay -f <文件格式> -pixel_format <像素格式> -video_size <视频尺寸> -i <文件路径>

其中，-pixel_format 表示像素格式，可以用 ffplay -pix_fmts 命令开查看当前支持的格式。

示例：

代码语言：javascript复制

$ ffplay -f rawvideo -pixel_format yuv420p -video_size 1280x720 -i input.yuv

3）播放编码数据

使用 ffplay 播放编码后的视频或音频文件如下所示：

代码语言：javascript复制

$ ffplay -i <文件路径>

示例：

代码语言：javascript复制

$ ffplay -i input.h264

4）播放封装数据

使用 ffplay 播放封装好的视频或音频文件如下所示：

代码语言：javascript复制

$ ffplay -i <文件路径>

示例：

代码语言：javascript复制

$ ffplay -i input.mp4

不过，这里还有一些可能会用到的功能可以关注一下：

4.1）播放控制

在播放音频或视频时，使用下列键盘按键可以进行播放控制：

w，切换播放模式，比如在音频波形图、音频频谱图、视频画面之间切换。
s，步进模式，每按一次就播放下一帧图像。
right，快进 10 s。
left，快退 10 s。
up，快退 1 min。
down，快退 1 min。
space，暂停。
esc，退出。

4.2）循环播放

通过 -loop 指定循环次数。

代码语言：javascript复制

$ ffplay -loop <循环播放次数> -i <文件路径>

4.3）播放某一路音频或视频

通过 -ast 和 -vst 分别指定音频流和视频流编号。

代码语言：javascript复制

$ ffplay -ast <音频流编号> -i <文件路径>
$ ffplay -vst <视频流编号> -i <文件路径>

如果不存在对应编号的音频流或视频流，则静音或没有画面。

4.4）设置音视频同步方式

通过 -sync 指定音视频同步方式。

代码语言：javascript复制

$ ffplay -sync <同步方式> -i <文件路径>

其中同步方式有 3 种，包括：

audio，以音频时钟为基准。
video，以视频时钟为基准。
ext，已外部时钟为基准。

3、ffprobe 命令行工具

ffprobe 是 FFmpeg 源码编译后生成的一个可执行程序。ffprobe 是一个很强大的多媒体分析工具，它可以从媒体文件或媒体流中获得音视频及媒体容器的参数信息。

1）查看媒体封装信息

使用 -show_format 来查看媒体封装信息。

代码语言：javascript复制

$ ffprobe -show_format <文件路径>

下面是输出信息示例及字段含义说明：

代码语言：javascript复制

[FORMAT]
filename=http://www.example.com/1.flv
nb_streams=2
nb_programs=0
format_name=flv
format_long_name=FLV (Flash Video)
start_time=4088.213000
duration=0.000000
size=N/A
bit_rate=N/A
probe_score=100
TAG:fileSize=0
TAG:audiochannels=2
TAG:encoder=xxx
[/FORMAT]

filename：文件名。
nb_streams：封装的流的数量，对应 AVFormatContext->nb_streams。
nb_programs：对应 AVFormatContext->nb_programs。
format_name：封装格式，对应 AVFormatContext->iformat->name。
format_long_name：封装格式完整名，对应 AVFormatContext->iformat->long_name。
start_time：开始时间，对应 AVFormatContext->start_time，基于 AV_TIME_BASE_Q，单位为秒。
duration：时长，对应 AVFormatContext->duration，基于 AV_TIME_BASE_Q，单位为秒。
size：大小，对应 avio_size(AVFormatContext->pb)，单位字节。
bit_rate：码率，对应 AVFormatContext->bit_rate。
probe_score：表示输入媒体文件的格式与其实际数据格式的匹配度，匹配度高则得分高（比如：1.mp4 确实是 mp4 格式），匹配度低则得分低（比如：1.mp4 其实是 wav 的格式）。对应 AVFormatContext->probe_score。
TAG:*：TAG 是从 metadata dump 处理的信息。

2）查看媒体流信息

使用 -show_streams 来查看媒体流信息。

代码语言：javascript复制

$ ffprobe -show_streams <文件路径>

下面是输出信息示例及字段含义说明：

代码语言：javascript复制

[STREAM]
index=0
codec_name=h264
codec_long_name=H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10
profile=High
codec_type=video
codec_time_base=1/30
codec_tag_string=[0][0][0][0]
codec_tag=0x0000
width=720
height=1280
coded_width=720
coded_height=1280
has_b_frames=1
sample_aspect_ratio=N/A
display_aspect_ratio=N/A
pix_fmt=yuv420p
level=31
color_range=unknown
color_space=unknown
color_transfer=unknown
color_primaries=unknown
chroma_location=left
field_order=progressive
timecode=N/A
refs=1
is_avc=true
nal_length_size=4
id=N/A
r_frame_rate=15/1
avg_frame_rate=15/1
time_base=1/1000
start_pts=1030
start_time=1.030000
duration_ts=N/A
duration=N/A
bit_rate=N/A
max_bit_rate=N/A
bits_per_raw_sample=8
nb_frames=N/A
nb_read_frames=N/A
nb_read_packets=N/A
DISPOSITION:default=0
DISPOSITION:dub=0
DISPOSITION:original=0
DISPOSITION:comment=0
DISPOSITION:lyrics=0
DISPOSITION:karaoke=0
DISPOSITION:forced=0
DISPOSITION:hearing_impaired=0
DISPOSITION:visual_impaired=0
DISPOSITION:clean_effects=0
DISPOSITION:attached_pic=0
DISPOSITION:timed_thumbnails=0
[/STREAM]
[STREAM]
index=1
codec_name=aac
codec_long_name=AAC (Advanced Audio Coding)
profile=LC
codec_type=audio
codec_time_base=1/48000
codec_tag_string=[0][0][0][0]
codec_tag=0x0000
sample_fmt=fltp
sample_rate=48000
channels=2
channel_layout=stereo
bits_per_sample=0
id=N/A
r_frame_rate=0/0
avg_frame_rate=0/0
time_base=1/1000
start_pts=55
start_time=0.055000
duration_ts=N/A
duration=N/A
bit_rate=N/A
max_bit_rate=N/A
bits_per_raw_sample=N/A
nb_frames=N/A
nb_read_frames=N/A
nb_read_packets=N/A
DISPOSITION:default=0
DISPOSITION:dub=0
DISPOSITION:original=0
DISPOSITION:comment=0
DISPOSITION:lyrics=0
DISPOSITION:karaoke=0
DISPOSITION:forced=0
DISPOSITION:hearing_impaired=0
DISPOSITION:visual_impaired=0
DISPOSITION:clean_effects=0
DISPOSITION:attached_pic=0
DISPOSITION:timed_thumbnails=0
[/STREAM]

视频流：

index：当前流的索引号，对应 AVStream->index。
codec_name：解码器名称，对应 AVCodecDescriptor *cd = avcodec_descriptor_get(AVStream->codecpar->codec_id); cd->name。
codec_long_name：解码器全名，对应 cd->long_name。
profile：编码等级，通过 avcodec_profile_name(AVStream->codecpar->codec_id, AVStream->codecpar->profile) 获得。
codec_type：流类型，即 av_get_media_type_string(AVStream->codecpar->codec_type)。
codec_time_base：编码的时间戳计算基础单位，对应 AVStream->codec->time_base。
codec_tag_string：编码器标签描述，对应 av_fourcc2str(AVStream->codecpar->codec_tag)。
codec_tag：对应 AVStream->codecpar->codec_tag。
width：有效区域的宽度，对应 AVStream->codecpar->width。
height：有效区域的高度，对应 AVStream->codecpar->height。
coded_width：视频帧宽度，可能与上面的宽度不同，因为有一些编码器要求帧的宽或高是某个数的倍数，所以如果输入的视频帧的宽或高不符合对应的规则时，则需要做填充，这里的 coded_width 就是填充后的宽度，在解码时需要用到这个参数来做对应的裁剪。对应 AVStream->codec->coded_width。
coded_height：视频帧高度，可能与上面的高度不同，对应 AVStream->codec->coded_height。
has_b_frames：是否包含 B 帧。
sample_aspect_ratio：简称 SAR，指的是图像采集时，横向采集点数与纵向采集点数的比例。FFmpeg提供了多个 SAR：AVStream->sample_aspect_ratio、AVStream->codecpar->sample_aspect_ratio、AVFrame->sample_aspect_ratio，通过 av_guess_sample_aspect_ratio 获取最终的 SAR。
display_aspect_ratio：简称 DAR，指的是真正展示的图像宽高比，在渲染视频时，必须根据这个比例进行缩放。通过 av_reduce 计算得到，PAR * SAR = DAR，其中 PAR 是 Pixel Aspect Ratio，表示单个像素的宽高比，大多数情况像素宽高比为 1:1，也就是一个正方形像素，如果不是 1:1，则该像素可以理解为长方形像素。
pix_fmt：像素格式，对应 av_get_pix_fmt_name(AVStream->codecpar->format)。
level：编码参数，对应AVStream->codecpar->level。
color_range：额外的色彩空间特征，对应 av_color_range_name(AVStream->codecpar->color_range)，AVCOL_RANGE_MPEG 对应 TV，AVCOL_RANGE_JPEG 对应 PC。
color_space：YUV 彩色空间类型，对应 av_color_space_name(AVStream->codecpar->color_space)。
color_transfer：颜色传输特性，对应 av_color_transfer_name(AVStream->codecpar->color_trc)。
color_primaries：对应 av_color_primaries_name(AVStream->codecpar->color_primaries)。
chroma_location：色度样品的位置，对应 av_chroma_location_name(AVStream->codecpar->chroma_location)。
field_order：交错视频中字段的顺序，对应 AVStream->codecpar->field_order。
timecode：通过 av_timecode_make_mpeg_tc_string 处理 AVStream->codec->timecode_frame_start 获得。
refs：参考帧数量，即 AVStream->codec->refs。
is_avc：是否 AVC。
nal_length_size：表示用几个字节表示 NALU 的长度。
id：
r_frame_rate：当前流的基本帧率，这个值仅是一个猜测，对应于 AVStream->r_frame_rate。
avg_frame_rate：平均帧率，对应于 AVStream->avg_frame_rate。
time_base：AVStream 的时间基准，即 AVStream->time_base。
start_pts：流开始的 PTS 时间戳，基于 time_base，即 AVStream->start_time。
start_time：转换 start_pts * time_base 之后的开始时间，单位秒。
duration_ts：流时长，基于 time_base，即 AVStream->duration。
duration：转换 duration_ts * time_base 之后的时长，单位秒。
bit_rate：码率，即 AVStream->codecpar->bit_rate。
max_bit_rate：最大码率，即 AVStream->codec->rc_max_rate。
bits_per_raw_sample：每个采样或像素的比特数，即 AVStream->codec->bits_per_raw_sample。
nb_frames：视频流中的帧数，即 AVStream->nb_frames。
nb_read_frames：略。
nb_read_packets：略。
TAG:*：对应 AVStream->metadata 中的信息。
- TAG:rotate：逆时针的旋转角度（相当于正常视频的逆时针旋转角度）。
side_data：在视频流中，有时候我们还会看到 side_data 数据，对应 AVStream->side_data，示例如下：

代码语言：javascript复制

[SIDE_DATA]
// side_data 数据类型，Display Matrix 表示一个 3*3 的矩阵，这个矩阵需要应用到解码后的视频帧上，才能正确展示：
side_data_type=Display Matrix
displaymatrix=
00000000:   0 65536    0
00000001: -65536  0    0
00000002:   0  0 1073741824
// 顺时针旋转 90 度还原视频
rotation=-90
[/SIDE_DATA]

音频流：

sample_fmt：采样格式，通过 av_get_sample_fmt_name(AVStream->codecpar->format) 获取。
sample_rate：采样率，即 AVStream->codecpar->sample_rate。
channels：声道数，即 AVStream->codecpar->channels。
channel_layout：声道类型，与 channels 是相对应，通过 av_bprint_channel_layout 获取，比如：mono 表示单声道，stereo 表示多声道。

3）查看媒体数据包信息

使用 -show_streams 来查看媒体数据包信息。

代码语言：javascript复制

$ ffprobe -show_packets <文件路径>

下面是输出信息示例及字段含义说明：

代码语言：javascript复制

[PACKET]
codec_type=audio
stream_index=0
pts=1690083
pts_time=1690.083000
dts=1690083
dts_time=1690.083000
duration=23
duration_time=0.023000
convergence_duration=N/A
convergence_duration_time=N/A
size=470
pos=2757652
flags=K_
[/PACKET]
[PACKET]
codec_type=video
stream_index=1
pts=1690232
pts_time=1690.232000
dts=1690099
dts_time=1690.099000
duration=33
duration_time=0.033000
convergence_duration=N/A
convergence_duration_time=N/A
size=11253
pos=2758139
flags=__
[/PACKET]

codec_type：帧类型。audio 表示音频帧，video 表示视频帧。
stream_index：当前帧所属流的索引，对应于 AVStream->index。
pts：帧的展示时间戳，即 AVPacket->pts，基于 AVStream->time_base 时间基准。
pts_time：转换 pts * time_base 之后的时长，单位秒。
dts：帧的解码时间戳，即 AVPacket->dts，基于 AVStream->time_base 时间基准。
dts_time：转换 dts * time_base 之后的时长，单位秒。
duration：当前帧的时长，等于下一帧的 pts 减去当前帧 pts，即 AVPacket->duration，基于 AVStream->time_base 时间基准。
duration_time：转换 duration * time_base 之后的时长，单位秒。
convergence_duration：略。
convergence_duration_time：略。
size：当前帧的大小。
pos：当前帧的位置，等于上一帧的 pos 加上当前帧的 size。
flags：略。

4）查看媒体帧信息

使用 -show_frames 来查看媒体帧信息。

代码语言：javascript复制

$ ffprobe -show_frames <文件路径>

下面是输出信息示例及字段含义说明：

代码语言：javascript复制

[FRAME]
media_type=video
stream_index=1
key_frame=0
pkt_pts=2084699
pkt_pts_time=2084.699000
pkt_dts=2084699
pkt_dts_time=2084.699000
best_effort_timestamp=2084699
best_effort_timestamp_time=2084.699000
pkt_duration=33
pkt_duration_time=0.033000
pkt_pos=3751477
pkt_size=2665
width=720
height=1280
pix_fmt=yuv420p
sample_aspect_ratio=N/A
pict_type=B
coded_picture_number=334
display_picture_number=0
interlaced_frame=0
top_field_first=0
repeat_pict=0
color_range=unknown
color_space=unknown
color_primaries=unknown
color_transfer=unknown
chroma_location=left
[/FRAME]
[FRAME]
media_type=audio
stream_index=0
key_frame=1
pkt_pts=2084707
pkt_pts_time=2084.707000
pkt_dts=2084707
pkt_dts_time=2084.707000
best_effort_timestamp=2084707
best_effort_timestamp_time=2084.707000
pkt_duration=23
pkt_duration_time=0.023000
pkt_pos=3775354
pkt_size=472
sample_fmt=fltp
nb_samples=1024
channels=2
channel_layout=stereo
[/FRAME]

视频帧：

media_type=：帧类型，即 av_get_media_type_string(AVStream->codecpar->codec_type)。
stream_index：当前帧所属流的索引，对应于 AVStream->index。
key_frame：是否关键帧（IDR)。
pkt_pts：帧的展示时间戳，即 AVFrame->pts，基于 AVStream->time_base 时间基准。
pkt_pts_time：转换 pkt_pts * time_base 之后的时长，单位秒。
pkt_dts：帧的解码时间戳，即 AVFrame->dts，基于 AVStream->time_base 时间基准。
pkt_dts_time：转换 pkt_dts * time_base 之后的时长，单位秒。
best_effort_timestamp：帧时间戳，基本与 pts 相同，如果当前 pts 存在不合理值，会尝试进行一系列校准来得到这个更合理的值，对应 AVFrame->best_effort_timestamp，基于 AVStream->time_base 时间基准。
best_effort_timestamp_time：转换 best_effort_timestamp * time_base 之后的时长，单位秒。
pkt_duration：对应的 AVPacket 的帧时长，即 AVFrame->pkt_duration，基于 AVStream->time_base 时间基准。
pkt_duration_time：转换 pkt_duration * time_base 之后的时长，单位秒。
pkt_pos：从最后一个已输入解码器的 AVPacket 重新排序的位置，即 AVFrame->pkt_pos。
pkt_size：对应的 AVPacket 的帧大小，即 AVFrame->pkt_size。
width：旋转之前的帧宽度，即 AVFrame->width。
height：旋转之前的帧高度，即 AVFrame->height。
pix_fmt：像素格式，对应 av_get_pix_fmt_name(AVFrame->format)。
sample_aspect_ratio：简称 SAR，指的是图像采集时，横向采集点数与纵向采集点数的比例。FFmpeg提供了多个 SAR：AVStream->sample_aspect_ratio、AVStream->codecpar->sample_aspect_ratio、AVFrame->sample_aspect_ratio，通过 av_guess_sample_aspect_ratio 获取最终的 SAR。
pict_type：视频帧的图片类型，即 av_get_picture_type_char(frame->pict_type)。
coded_picture_number：帧在比特流中的编号，即 AVFrame->coded_picture_number。
display_picture_number：帧的显示编号，即 AVFrame->display_picture_number。
interlaced_frame：视频帧内容是否是交错的，即 AVFrame->interlaced_frame。
top_field_first：若视频帧内容是交错的，表示首先展示的顶部域，即 AVFrame->top_field_first。
repeat_pict：当解码时，这个信号表明视频帧必须延迟多少。extra_delay = repeat_pict / (2*fps)，即 AVFrame->repeat_pict。
color_range：额外的色彩空间特征，即 av_color_range_name(AVFrame->color_range)，AVCOL_RANGE_MPEG 对应 TV，AVCOL_RANGE_JPEG 对应 PC。
color_space：YUV 彩色空间类型，即 av_color_space_name(AVFrame->colorspace)。
color_primaries：即 av_color_primaries_name(AVFrame->color_primaries)。
color_transfer：颜色传输特性，即 av_color_transfer_name(AVFrame->color_trc)。
chroma_location：色度样品的位置，即 av_chroma_location_name(AVFrame->chroma_location)。

音频帧：

sample_fmt：采样格式，通过 av_get_sample_fmt_name(AVFrame->format) 获取。
sample_rate：采样率，即 AVFrame->sample_rate。
channels：声道数，即 AVFrame->channels。
channel_layout：声道类型，与 channels 是相对应，通过 av_bprint_channel_layout 获取，比如：mono 表示单声道，stereo 表示多声道。

本文参考

1）《FFmpeg 从入门到精通》

https://book.douban.com/subject/30178432/

2）FFmpeg 之 ffprobe https://juejin.im/post/5d5cbb9af265da03f564e757

（通过上文的介绍，我们了解了 ffmpeg、ffplay、ffprobe 等常用的命令用法，这对我们平时的音视频开发工作非常有用。我们将在后面继续探讨其他好用的音视频工具，敬请期待）

- 完 -

python 视频处理云直播

0 人点赞