1、两种声码器,神经网络声码器,world声码器
神经网络声码器把声学特征,比如梅尔谱转为波形
world声码器通过频谱分析比如fft得到参数参数,然后参数合成波形
2、输入数据大概分三类 pitch durtion content 。内部模型设计也可对应
3、拓展和优化有几个方面
a、高精度
b、数据对齐
c、speech 2 song
d、迁移学习特定teacher
1、两种声码器,神经网络声码器,world声码器
神经网络声码器把声学特征,比如梅尔谱转为波形
world声码器通过频谱分析比如fft得到参数参数,然后参数合成波形
2、输入数据大概分三类 pitch durtion content 。内部模型设计也可对应
3、拓展和优化有几个方面
a、高精度
b、数据对齐
c、speech 2 song
d、迁移学习特定teacher
本文标题:SVS笔记
本文链接:https://www.haomeiwen.com/subject/hizjnrtx.html
网友评论