【音视频原理】音频编解码原理 ② ( 采样值 - 本质分析 | 采样值 - 震动振幅值 | 采样值的录制与播放 | 采样值在播放设备中才有意义 | 音频采样率 | 音频采样精度 | 音频通道数 )

2024-01-26 10:44:44 浏览数 (2)

一、采样值 - 本质分析


1、采样值 - 震动振幅值

物体 发生 震动 , 在 空气中传播 , 被 人耳 接收 产生 我们理解中的声音 ;

物体 震动 , 产生 的 振幅 , 就是 声音的 响度 , 振幅 越大 , 响度越大 ;

如 :

  • 声带震动 , 产生声音 ;
  • 乐器震动 , 产生声音 ;

物体 震动 的 振幅 , 就是 声音 的 响度值 , 就是 采样值 ;

假设 采样位数 是 8 位 , 可以 表示 256 种响度值 , 取值范围是 -128 ~ 127 ;

2、采样值的录制与播放

使用 录音设备 , 录制音频 , 某个时间戳 时刻 获取的 采样值 100 , 此时 100 这个值 , 是一个数值 , 这个数值 单独 拿出来 没有任何意义 ;

将 这个数值 100 输出 到 音响中 , 此时 音响的输出设置 的 采样位数 也是 8 位 , 将 100 放到音响中 , 就可以 还原 录制视频时的 震动振幅 , 发出对应 时间戳时刻 的声音 ;

3、采样值与声音的分贝值无关

100 这个值 与 真实的音量响度 , 也就是分贝值 , 没有关系 , 播放的声音大小只与录音设备参数有关 ;

如 : 录制 50 分贝的声音 , 不同的录音设置录制的 采样值 是不同的 , 相同的录音设备 使用不同的参数 录制的采样值也是不同的 , 50 分贝的声音可以是 100 采样值 , 也可以是 50 采样值 ;

100 采样值 在 播放设备中 播放的 声音分贝数 大小 也是无关 的 , 在 手机中 播放 100 采样值 是 40 分贝 , 在 大功率 扬声器 中播放 100 采样值 可能就是 80 分贝 , 播放 100 采样值 的 分贝数 与 播放设备及参数有关 ;

4、采样值在播放设备中才有意义

这个 100 的采样值 , 拿在手里 没有任何作用 , 也听不到声音 , 只有在 播放环境 中 , 在 音响 / 扬声器 设备中 才有意义 ;

如果 播放的设备 的 采样位数 不是 8 位 , 而是 16 位 , 那么 就需要 将 100 这个值 转为 16 位 的采样值 ,

将 100 处于 取值范围 -128 ~ 127 , 等比例放大到 -32768 ~ 32767 取值范围中 , 计算过程如下 :

cfrac{100}{128} times 32768 =25600

最后将 重采样的 25600 采样值 输入到 16 位采样位数的 音响中 ;

二、音频概念 - 采样率 / 采样精度 / 音频通道


1、常用的音频采样率

常用的音频采样频率 :

  • 22000 Hz : 常用于 无线广播 ;
  • 44100 Hz : 常用于 CD 音质 ;
  • 48000 Hz : DVD 和 数字电视音质 ;
  • 96000 Hz : 蓝光 和 高清 DVD 音质 ;
  • 192000 Hz : 蓝光 和 高清 DVD 音质 ;

人耳 能听到的 频率范围是 20Hz ~ 20000Hz , 那么 根据 " 奈奎斯特 Nyguist 采样定理 " , 想要保证 人耳听到的声音 不失真 , 需要使用 40000Hz 以上的采样率 ;

人耳听到的 超过 44100Hz 的采样频率 的 音频 , 与 更高采样频率 的音频 , 效果是一样的 ;

注意 : 使用 高端 音响设备 发出的 超过 44100Hz 的采样频率 的 声音 与 低端设备发出的 声音 , 是不同的 , 因为谐振不同 ;

2、音频采样精度

音频采样精度 , 就是 采样值 的位数 , 常见的采样位数有 :

  • 8 位采样精度 : 使用 1 字节数据表示 单个音频采样 ; 这是早期的数字音频系统使用 8 位采样精度 , 每个采样点可以用
2^8 = 256

个不同的值来表示 , 这种精度相对较低 , 产生的音频质量较为粗糙 , 有明显的量化噪声 ;

  • 16 位采样精度 : 使用 2 字节数据表示 单个音频采样 ; 这是最常见的采样精度 , 该采样精度 提供了
2^{16} = 65536

不同的值来表示每个采样点 , 该精度可以提供相当高的音频质量 , 适用于大多数 音乐 / 电影 / 多媒体应用 ;

  • 24 位采样精度 : 使用 3 字节数据表示 单个音频采样 ; 适用于 更高动态范围 和 更低噪声的 应用场景 , 如专业录音室或音频后期制作 ; 该采样精度提供了
2^{24} = 16777216

个不同的值 , 可以捕获更细微的音频细节 ;

  • 32位采样精度 : 使用 4 字节数据表示 单个音频采样 ; 32 位 的 采样精度提供了非常高的动态范围和信噪比 , 常用于 特定的专业领域 , 如 : 数字音频工作站 " DAW , Digital Audio Workstation " , 中的浮点音频处理 ; 这种精度提供了
2^{32} = 4,294,967,296

( 大约 43 亿 ) 个不同的值来表示每个采样点 , 几乎可以消除量化噪声 ;

3、音频通道数

音频通道数 :

  • 单声道 : 单声道音频只有一个声道 , 即声音只能从一个方向传来 , 无法区分左右声道 ; 它通常用于较简单的音频设备 , 如 : 收音机、便携式播放器 ;
  • 双声道 : 又叫 " 立体声 " , 包含左右两个声道 , 左右声道的声音信号经过处理后 , 可以模拟出人耳对声音的定位感 , 使得听者能够感受到声音的方向和立体感 ;
  • 四声道 : 四声道 环绕音频 在 " 立体声 " 的基础上 增加了 后置左右两个声道 , 通过更多扬声器的布置 , 提供 更加宽广 和 包围感更强 的音频体验 ; 常用于家庭影院系统 ;
  • 5.1 声道 : 前置左、前置右、中置、后置左、后置右 五个正常音频声道音箱 , 然后加上一个 低音炮 是 0.1 的那部分 , 常用于电影院 或 游戏音频 ;

0 人点赞