当前位置 博文首页 > 提取视频中的音频 Python只需要三行代码!

    提取视频中的音频 Python只需要三行代码!

    作者:叶庭云 时间:2021-06-08 18:26

    身处数据爆炸增长的信息时代,各种各样的数据都飞速增长,视频数据也不例外。我们可以使用 python 来提取视频中的音频,而这仅仅需要安装一个体量很小的 python 库,然后执行三行代码!

    语音数据在数据分析领域极为重要。比如可以分析语义、口音、根据人的情绪等等。可以应用于偏好分析、谎话检测等等。

    一、提取音频

    需要用到 python 的 moviepy 库

    moviepy的 github 地址:https://github.com/Zulko/moviepy

    命令行 pip 安装上 moviepy 即可!

    pip install moviepy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
    

    提取音频:假设有一个 mp4 文件路径为"D:\python\pycharm2020\my_program\video_process\test_01.mp4",我们想提取其中的音频保存到"D:\python\pycharm2020\my_program\video_process\vst01.mp3",三行 Python 代码实现如下:

    import moviepy.editor as mpy
    
    
    # 截取背景音乐
    audio_background = mpy.AudioFileClip(r'D:\python\pycharm2020\my_program\video_process\test_01.mp4').subclip(1, 60)
    audio_background.write_audiofile(r'D:\python\pycharm2020\my_program\video_process\vst01.mp3')
    

    结果如下:

    执行上面的三行代码,就会发现音频文件已经成功提取到指定文件夹啦~ ~这里的视频格式和音频格式都支持其他格式,比如读取 mp4 格式视频,抽取其中的背景音乐保存为 MP3 格式音频。

    二、引力波绘制

    数据来源:

    • http://python123.io/dv/grawave.html
    • http://python123.io/dv/H1_Strain.wav
    • http://python123.io/dv/L1_Strain.wav
    • http://python123.io/dv/wf_template.txt

    从配置文档中读取时间相关数据

    import numpy as np  # 科学计算所用的numpy库
    import matplotlib.pyplot as plt  # 绘图所用的库matplotlib
    from scipy.io import wavfile  # 读取波形文件所用的库
    
    
    rate_h, hstrain = wavfile.read(r"H1_Strain.wav", "rb")   # 读取音频文件
    rate_l, lstrain = wavfile.read(r"L1_Strain.wav", "rb")
    # reftime, ref_H1 = np.genfromtxt('GW150914_4_NR_waveform_template.txt').transpose()
    reftime, ref_H1 = np.genfromtxt('wf_template.txt').transpose()  # 使用python123.io下载txt文件
    

    构造应变数据

    htime_interval = 1 / rate_h
    ltime_interval = 1 / rate_l
    fig = plt.figure(figsize=(12, 6))  # 创建大小为12*6的绘图空间
    
    # 丢失信号起始点
    htime_len = hstrain.shape[0] / rate_h  # 读取数据第一维的长度,得到函数在坐标轴上总长度
    htime = np.arange(-htime_len / 2, htime_len / 2, htime_interval)  # (起点,终点,时间间隔)
    

    使用来自 “H1” 探测器的数据作图

    plth = fig.add_subplot(221)  # 设置绘图区域
    plth.plot(htime, hstrain, 'r')  # 画出以时间为x轴,应变数据为y轴的图像,‘y'为黄色
    plth.set_xlabel('Time (seconds)')
    plth.set_ylabel('H1 Strain')
    plth.set_title('H1 Strain')
    

    绘制 L1 Strain 和Template

    ltime_len = lstrain.shape[0] / rate_l
    ltime = np.arange(-ltime_len / 2, ltime_len / 2, ltime_interval)
    pltl = fig.add_subplot(222)
    pltl.plot(ltime, lstrain, 'k')
    pltl.set_xlabel('Time (seconds)')
    pltl.set_ylabel('L1 Strain')
    pltl.set_title('L1 Strain')
    
    pltref = fig.add_subplot(212)
    pltref.plot(reftime, ref_H1, 'purple')
    pltref.set_xlabel('Time (seconds)')
    pltref.set_ylabel('Template Strain')
    pltref.set_title('Template')
    fig.tight_layout()  # 自动调整图像外部边缘
    

    保存并显示图像

    plt.savefig("Gravitational_Waves_Original.png")  # 保存图像为png格式
    plt.show()
    plt.close(fig)
    

    结果如下:

    js