美文网首页
使用Go播放音频:合成波形

使用Go播放音频:合成波形

作者: 豆腐匠 | 来源:发表于2020-10-29 17:31 被阅读0次

原文地址:https://dylanmeeus.github.io/posts/audio-from-scratch-pt8/

在之前的文章中我们首先研究了如何用“原始”浮点数生成正弦波并使用ffplay对其进行解析。后来,我们探讨了如何读取/写入.wave文件以及如何使用断点提取以及创建“自动化轨道”。

你可能已经注意到,我们从未真正使用自己的声音数据从头开始创建.wave文件。现在该改变它了。在此文中,我们将研究如何创建各种基本声波。

本文的代码可以在Github示例中找到,也可以作为GoAudio库的一部分找到。

构造一个振荡器

振荡器是一种产生周期性(振荡)信号的设备(在我们的场景下是一段代码)。正弦波就是这种波形的一个例子,但我们还将介绍方波,三角波和锯齿波。

在本文的结尾,您将能够生成如下所示的信号:

image

在图像上,它们看起来像连接的线,但是在我们将生成的数字音频信号中,它们是单独的数据点。每个周期有几个“点”?这取决于我们使用的采样率。

我们可以弄清楚在给定的情况下如何找到sample rate。请记住,我们在trig函数中使用了弧度,因此周期定义为:2 * PI。要知道如何放置点,我们可以找出难点的一部分(“增量”),如下所示:

increment = (2 * PI) / SampleRate

不幸的是,这还不是全部。我们也要记住,我们的波具有一定的频率-我们必须在增量中加以考虑。实际功能将变为:

increment = ((2 * PI) / SampleRate) * freq

Oscillator中,我们必须跟踪这些东西。我们想知道当前频率是多少,当前相位是什么,以及如何增加该相位以获得波的下一个值。

这仅解决了部分难题。现在也很清楚,我们需要一种方法来区分用户想要生成哪种波形。为此,我们可以从Shape类型的“枚举”开始。每个形状也需要以不同的方式进行计算,因此我们可以将Shape与计算函数相关联shapeCalcFunc = map[Shape]func(float64)float64

type Shape int

const (
    SINE Shape = iota
    SQUARE
    DOWNWARD_SAWTOOTH
    UPWARD_SAWTOOTH
    TRIANGLE
)

var (
    shapeCalcFunc = map[Shape]func(float64) float64{
        SINE:              sineCalc,
        SQUARE:            squareCalc,
        TRIANGLE:          triangleCalc,
        DOWNWARD_SAWTOOTH: downSawtoothCalc,
        UPWARD_SAWTOOTH:   upwSawtoothCalc,
    }
)

这些是我们的“基本”形状,将在接下来的几篇文章中使用。尽管我将继续介绍它们,但它们将为我们提供坚实的基础。

将刚刚提到的这些放在一起,我们可以定义一个Oscillator结构体:


type Oscillator struct {
    curfreq  float64
    curphase float64
    incr     float64
    twopiosr float64 // (2*PI) / samplerate
    tickfunc func(float64) float64
}

// NewOscillator set to a given sample rate
func NewOscillator(sr int, shape Shape) (*Oscillator, error) {
    cf, ok := shapeCalcFunc[shape]
    if !ok {
        return nil, fmt.Errorf("Shape type %v not supported", shape)
    }
    return &Oscillator{
        twopiosr: tau / float64(sr), // (2 * PI) / SampleRate
        tickfunc: cf,
    }, nil
}

|

请注意,我们将twopiosr = tau / SampleRate = (2 * PI) / SampleRate存储为结构体变量。我们将在几个函数中使用它。

产生波形

有了这个构造函数,我们就有了一个工作振荡器的基础,但是它还没有产生任何东西。为此,我们需要一个函数,要求振荡器产生波的下一个值(它可以无限期地执行此操作)。此功能需要做一些事情:

  • 接受波产生的频率
  • 调整帧之间的增量
  • 在此相位找到值
  • 调整当前相位
  • 对相位进行一些边界检查(可选)

我们在Go中的功能变为:

func (o *Oscillator) Tick(freq float64) float64 {
    if o.curfreq != freq {
        o.curfreq = freq
        o.incr = o.twopiosr * freq
    }
    val := o.tickfunc(o.curphase)
    o.curphase += o.incr
        
        // adjust bounds
    if o.curphase >= tau {
        o.curphase -= tau
    }
    if o.curphase < 0 {
        o.curphase = tau
    }
    return val
}

对我们当前阶段的调整是将其保持在边界内(尽管根据sin函数的实现,这可能不是必需的,我仍做保留,但我敢肯定在Go中是不必要的)。

波形函数

剩下要实现的唯一部分是不同形状的波形的实际生成。这就是val := o.tickfunc(o.curphase)调用中发生的情况。通过使用通用函数调用,我们可以在对NewOscillator()的调用中注入正确的计算函数。

最容易实现的是正弦波。

func sineCalc(phase float64) float64 {
    return math.Sin(phase)
}

最简单的实现方式可能是方波函数。在这种情况下,我们1的一半是,另一半是-1

func squareCalc(phase float64) float64 {
    val := -1.0
    if phase <= math.Pi {
        val = 1.0
    }
    return val
}

三角波是第一个看起来更复杂的波,锯齿波与之相关(可以从视觉上看到锯齿成为三角形的一部分,并且具有陡峭的截止点。

func triangleCalc(phase float64) float64 {
    val := 2.0*(phase*(1.0/tau)) - 1.0
    if val < 0.0 {
        val = -val
    }
    val = 2.0 * (val - 0.5)
    return val
}

func upwSawtoothCalc(phase float64) float64 {
    val := 2.0*(phase*(1.0/tau)) - 1.0
    return val
}

func downSawtoothCalc(phase float64) float64 {
    val := 1.0 - 2.0*(phase*(1.0/tau))
    return val
}

生成波

设置好振荡器后,我们终于可以开始使用它了。以下所有代码都包含在此GoAudio示例中。

func main() {
    flag.Parse()
    fmt.Println("usage: go run main -d {dur} -s {shape} -a {amps} -f {freqs} -o {output}")
    if output == nil {
        panic("please provide an output file")
    }

    wfmt := wave.NewWaveFmt(1, 1, 44100, 16, nil)
    amps, err := ioutil.ReadFile(*amppoints)
    if err != nil {
        panic(err)
    }
    ampPoints, err := breakpoint.ParseBreakpoints(bytes.NewReader(amps))
    if err != nil {
        panic(err)
    }
    ampStream, err := breakpoint.NewBreakpointStream(ampPoints, wfmt.SampleRate)

    freqs, err := ioutil.ReadFile(*freqpoints)
    if err != nil {
        panic(err)
    }
    freqPoints, err := breakpoint.ParseBreakpoints(bytes.NewReader(freqs))
    if err != nil {
        panic(err)
    }
    freqStream, err := breakpoint.NewBreakpointStream(freqPoints, wfmt.SampleRate)
    if err != nil {
        panic(err)
    }
    // create wave file sampled at 44.1Khz w/ 16-bit frames

    frames := generate(*duration, stringToShape[*shape], ampStream, freqStream, wfmt)
    wave.WriteFrames(frames, wfmt, *output)
    fmt.Println("done")
}

注意,我们还打印了用法,这告诉我们持续时间,形状,幅度断点,频率断点,最后是输出文件。“繁重的工作”发生在对generate 的调用中。在这里,我们传递持续时间,从CLI上输入的字符串派生的Shape实例,我们的断点以及最后一个WaveFmt。请记住,WaveFmt结构包含我们正在生成.wave的文件的元数据。在这种情况下,wave.NewWaveFmt(1, 1, 44100, 16, nil)表示这是一个标准PCM波形文件,在44.1Khz上播放1个通道(单声道),其中数据由16位浮点数组成。你可以使用这些值来查看结果如何变化。

最后,在generate函数中,我们需要计算需要生成的样本数量(=单帧)。然后,我们将调用Tick振荡器的函数以及断点流,以连续获取下一个值。

func generate(dur int, shape synth.Shape, ampStream, freqStream *breakpoint.BreakpointStream, wfmt wave.WaveFmt) []wave.Frame {
    reqFrames := dur * wfmt.SampleRate
    frames := make([]wave.Frame, reqFrames)
    osc, err := synth.NewOscillator(wfmt.SampleRate, shape)
    if err != nil {
        panic(err)
    }

    for i := range frames {
        amp := ampStream.Tick()
        freq := freqStream.Tick()
        frames[i] = wave.Frame(amp * osc.Tick(freq))
    }

    return frames
}

到这里,我们现在已经拥有所有用于生成基本波形的代码。当检查它们时,我们将得到在本文开头显示的结果。

改进之处

这样我们就可以生成基本的“干净”的音频信号,这对于测试目的可能是方便的,但是据我所知也就到此为止了。(大多数软件合成器也可以让你体验这些类型的wave,但是你可以将它们调整为更有用的功能)。

你可能对此代码有些担心,首先是性能问题。根据定义,振荡器是重复的,但我们一直在计算“下一阶段”。这是绝对必要的吗?不,我们实际上可以将期望看到的值存储在“查找表”中。

在下一篇文章中,我们将研究如何使用查找表,我们还将开始考虑谐波,以更真实的方式表示声音。

相关文章

网友评论

      本文标题:使用Go播放音频:合成波形

      本文链接:https://www.haomeiwen.com/subject/wlzdmktx.html