最新 最热

使用 JDAudioCrawler 将下载的音频存储到本地存储

在当今数字化时代,音频数据的获取和处理变得越来越重要。本文将访问网易云音乐为案例,介绍如何使用JDAudioCrawler这个强大的工具,将音频数据存储下载到本地存储中。将详细介绍实现的流程和代码细节。...

2023-10-25
1

NeurIPS 2023 | CoDi: 利用可组合扩散实现任意组合模态的处理与生成

图1 CoDi可以处理任意模态组合的输入,从而生成任意模态组合的输出。如视频、图像、音频和文本(由彩色箭头描绘的示例组合)

2023-10-24
0

Whisper 整体架构图

Transformer 模块,包含一个自注意力,一个交叉注意力(可选)和一个 MLP 模块。

2023-10-23
0

FFmpeg中的常用结构体分析

在学习使用FFmpeg进行编解码时,我们有必要先去熟悉FFmpeg中的常用结构体,只有对它们的含义和用途有深刻的了解,我们才能为后面的学习打下坚实的基础。所以,这篇文章将会介绍这些常用的结构体有哪些,然后再介绍它们的具体用...

2023-10-22
1

音视频基础知识

视频编码是指采用某种算法对视频数据进行压缩,以便在存储和传输时占用更少的空间和带宽。我们平时所看的视频其实都是由大量的图像帧组成的,比如,如果帧率为30fps,则相当于一秒播放了三十个图像,如果把每一张图像帧都完整...

2023-10-22
1

使用libswresample库实现音频重采样

在音频重采样时,用到的核心结构是SwrContext,我们可以通过swr_alloc()获取swr_ctx实例,然后通过av_opt_set_int()函数和av_opt_set_sample_fmt()函数来设置音频重采样的参数,最后通过swr_init()函数初始化SwrContext实例...

2023-10-22
1

如何使用libavfilter库给pcm音频采样数据添加音频滤镜?

初始化音频滤镜的方法基本上和初始化视频滤镜的方法相同,不懂的可以看上篇博客,这里直接给出代码:

2023-10-22
1

如何将mp4文件解复用并且解码为单独的.yuv图像序列以及.pcm音频采样数据?

在音视频的解复用的过程中,有一个非常重要的结构体AVFormatContext,即输入文件的上下文句柄结构,代表当前打开的输入文件或流。我们可以将输入文件的路径以及AVFormatContext **format_ctx 传入函数avformat_open_input...

2023-10-22
1

使用libavcodec将mp3音频文件解码为pcm音频采样数据【[mp3float @ 0x561c1ec49940] Header missing】

想要解决上面提到的问题,我们需要对mp3文件的格式有个大致了解,为了方便讲解,我这里画了个示意图:

2023-10-22
1

如何将PCM格式的原始音频采样数据编码为MP3格式或AAC格式的音频文件?

音频采样格式可以分为packed和planar两类。以packed格式保存的采样数据,各声道间按照采样值交替存储;以planar格式保存的采样数据,各个采样值按照不同声道连续存储...

2023-10-22
1