用于说话人识别领域中声学特征域自适应的CYCLE-GANS
解决问题:域不匹配问题
解决方法:在声学特征等级使用CYCLE-GANS在域之间学习特征映射的域自适应
实验结果:We achieved 9.37% and 2.82% relative improvement in equal error rate (EER) and detection cost function (DCF) on SITW eval set.
关键词:Unsupervised domain adaptation, speaker
recognition, cycle-GANs, generative adversarial neural networks
(GANs)
众所周知,训练和评估数据集之间的域不匹配阻碍了任何机器学习系统的性能。在说话人识别领域,域不匹配主要存在于录音设备和语言之间。大多数说话人识别的语料库是电话语音,很少是麦克风语音。
本工作是探索在声学特征等级使用CYCLE-GANS在域之间学习特征映射的域自适应,域之间没有任何并行数据。映射到电话域的麦克风特征用于评估仅在电话数据上训练集的说话人识别系统。
网友评论