身处数据爆炸增长的信息时代,各种各样的数据都飞速增长,视频数据也不例外。我们可以使用 python 来提取视频中的音频,而这仅仅需要安装一个体量很小的 python 库,然后执行三行代码!
语音数据在数据分析领域极为重要。比如可以分析语义、口音、根据人的情绪等等。可以应用于偏好分析、谎话检测等等。
一、提取音频
需要用到 python 的 moviepy 库
moviepy的 github 地址:https://github.com/Zulko/moviepy
命令行 pip 安装上 moviepy 即可!
pip install moviepy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
提取音频:假设有一个 mp4 文件路径为"D:pythonpycharm2020my_programvideo_process est_01.mp4",我们想提取其中的音频保存到"D:pythonpycharm2020my_programvideo_processvst01.mp3",三行 Python 代码实现如下:
import moviepy.editor as mpy # 截取背景音乐 audio_background = mpy.AudioFileClip(r'D:pythonpycharm2020my_programvideo_process est_01.mp4').subclip(1, 60) audio_background.write_audiofile(r'D:pythonpycharm2020my_programvideo_processvst01.mp3')
结果如下:
执行上面的三行代码,就会发现音频文件已经成功提取到指定文件夹啦~ ~这里的视频格式和音频格式都支持其他格式,比如读取 mp4 格式视频,抽取其中的背景音乐保存为 MP3 格式音频。
二、引力波绘制
数据来源:
- http://python123.io/dv/grawave.html
- http://python123.io/dv/H1_Strain.wav
- http://python123.io/dv/L1_Strain.wav
- http://python123.io/dv/wf_template.txt
从配置文档中读取时间相关数据
import numpy as np # 科学计算所用的numpy库
import matplotlib.pyplot as plt # 绘图所用的库matplotlib
from scipy.io import wavfile # 读取波形文件所用的库
rate_h, hstrain = wavfile.read(r"H1_Strain.wav", "rb") # 读取音频文件
rate_l, lstrain = wavfile.read(r"L1_Strain.wav", "rb")
# reftime, ref_H1 = np.genfromtxt('GW150914_4_NR_waveform_template.txt').transpose()
reftime, ref_H1 = np.genfromtxt('wf_template.txt').transpose() # 使用python123.io下载txt文件
构造应变数据
htime_interval = 1 / rate_h
ltime_interval = 1 / rate_l
fig = plt.figure(figsize=(12, 6)) # 创建大小为12*6的绘图空间
# 丢失信号起始点
htime_len = hstrain.shape[0] / rate_h # 读取数据第一维的长度,得到函数在坐标轴上总长度
htime = np.arange(-htime_len / 2, htime_len / 2, htime_interval) # (起点,终点,时间间隔)
使用来自 “H1” 探测器的数据作图
plth = fig.add_subplot(221) # 设置绘图区域
plth.plot(htime, hstrain, 'r') # 画出以时间为x轴,应变数据为y轴的图像,‘y'为黄色
plth.set_xlabel('Time (seconds)')
plth.set_ylabel('H1 Strain')
plth.set_title('H1 Strain')
绘制 L1 Strain 和Template
ltime_len = lstrain.shape[0] / rate_l
ltime = np.arange(-ltime_len / 2, ltime_len / 2, ltime_interval)
pltl = fig.add_subplot(222)
pltl.plot(ltime, lstrain, 'k')
pltl.set_xlabel('Time (seconds)')
pltl.set_ylabel('L1 Strain')
pltl.set_title('L1 Strain')
pltref = fig.add_subplot(212)
pltref.plot(reftime, ref_H1, 'purple')
pltref.set_xlabel('Time (seconds)')
pltref.set_ylabel('Template Strain')
pltref.set_title('Template')
fig.tight_layout() # 自动调整图像外部边缘
保存并显示图像
plt.savefig("Gravitational_Waves_Original.png") # 保存图像为png格式
plt.show()
plt.close(fig)
结果如下:
以上就是python提取视频中的音频的详细内容,更多python学习内容请关注W3Cschool其它相关文章!