Python 音频的数据扩充

作者: SpikeKing | 来源:发表于2018-04-12 11:15 被阅读185次

经典的深度学习网络AlexNet使用数据扩充(Data Augmentation)的方式扩大数据集,取得较好的分类效果。在深度学习的图像领域中,通过平移、 翻转、加噪等方法进行数据扩充。但是,在音频(Audio)领域中,如何进行数据扩充呢?

Audio

音频的数据扩充,主要有以下四种方式:

  • 音频剪裁(Clip)
  • 音频旋转(Roll)
  • 音频调音(Tune)
  • 音频加噪(Noise)

音频解析基于librosa音频库;矩阵操作基于scipy和numpy科学计算库。

以下是Python的实现方式:

音频剪裁

import librosa
from scipy.io import wavfile

y, sr = librosa.load("../data/love_illusion.mp3")  # 读取音频
print y.shape, sr
wavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr])  # 写入音频

音频旋转

import librosa
import numpy as np
from scipy.io import wavfile

y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频
y = np.roll(y, sr*10)
print y.shape, sr
wavfile.write("../data/raw/xxx_roll.mp3", sr, y)  # 写入音频

音频调音,注:cv库的resize函数含有插值功能。

import cv2
import librosa
from scipy.io import wavfile

y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频
ly = len(y)
y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze()
lc = len(y_tune) - ly
y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]
print y.shape, sr
wavfile.write("../data/raw/xxx_tune.mp3", sr, y)  # 写入音频

音频加噪,注:在添加随机噪声时,保留0值,否则刺耳难忍!

import librosa
from scipy.io import wavfile
import numpy as np

y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频
wn = np.random.randn(len(y))
y = np.where(y != 0.0, y + 0.02 * wn, 0.0)  # 噪声不要添加到0上!
print y.shape, sr
wavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y)  # 写入音频

欢迎Follow我的GitHubhttps://github.com/SpikeKing

By C. L. Wang @ 美图云事业部

OK, that's all! Enjoy it!

相关文章

  • Python 音频的数据扩充

    经典的深度学习网络AlexNet使用数据扩充(Data Augmentation)的方式扩大数据集,取得较好的分类...

  • Python 音频数据扩充的技巧

    经典的深度学习网络AlexNet使用数据扩充(Data Augmentation)的方式扩大数据集,取得较好的分类...

  • Python音频数据扩充比图像数据扩充更简单!

    经典的Python深度学习网络Alex Net使用数据扩充的方式扩大数据集,取得较好的分类效果。在Python深度...

  • 模型集成

    数据层面的集成: 测试阶段数据扩充:训练阶段的若干数据扩充策略,实际上,这些 扩充策略在模型测试阶段同样适用,诸如...

  • Python音频操作工具PyAudio上手教程!

    0.引子 当需要使用Python处理音频数据时,使用python读取与播放声音必不可少,下面介绍一个好用的处理音频...

  • 006零基础学Python:Python 文件I/O和File方

    Python 文件I/O和File方法 概念扩充 Input/Output,也就是输入和输出由于程序和运行时数据是...

  • 解题思维

    你的问题是? 扩充知识领域:机器学习 需要的知识基础:python;数据科学运算工具;数学知识 对数学的理解:如何...

  • 三.数据扩充

    深度卷积网络自身拥有强大的表达能力,不过正因如此,网络本身需至海量数据来驱动模型训练,否则便有极大可能陷入过拟合的...

  • 吴恩达深度学习笔记(90)-数据扩充(Data augmenta

    数据扩充(Data augmentation) 大部分的计算机视觉任务使用很多的数据,所以数据扩充是经常使用的一种...

  • Numpy

    NumPy ( Numerical Python)是支持 Python 语言的数值计算扩充库,其拥有强大的多维数组...

网友评论

    本文标题:Python 音频的数据扩充

    本文链接:https://www.haomeiwen.com/subject/gxdxkftx.html