国际标准协会 档案文件 2014年国际演讲
ISCA公司 档案文件 2014年国际演讲

基于相位信息的非特定人合成语音检测的交叉声码器研究

Jon Sanchez、Ibon Saratxaga、Inma Hernaez、Eva Navas、Daniel Erro

当前的说话人验证系统容易受到高级语音处理技术的影响,例如语音转换和TTS系统的说话者自适应。已经开发出有效的防溅系统,可以区分人工冒牌和合成冒牌。然而,它们中的许多仍然存在两个主要缺点:对说话人的依赖,更重要的是,对伪造技术的依赖。因此,获得通用合成语音检测器(SSD)仍然是一个悬而未决的问题。本文探讨了将统计分类器用于人类和合成语音的这种系统的可行性。由于假冒技术的多样性,我们选择对各种最先进的最小相位声码器进行建模,通过复制合成创建冒牌合成信号。使用了两个语音参数集:MFCC作为标准基线和基于相对相移(RPS)的参数化。由于大多数语音合成和转换技术忽略相位信息,因此相位相关参数允许基于人类信号和合成信号可能不同的相位结构进行合成语音检测。实验结果表明,非特定人分类器对每个声码器都有很好的性能。交叉编码器实验表明,该系统高度依赖于声码器类型,对于多声码器模型,RPS参数化的性能优于MFCC。


doi:10.21437/Interspeech.2014-393

引自:Sanchez,J.、Saratxaga,I.、Hernaez,I.,Navas,E.、Error,D.(2014)使用相位信息进行非特定人合成语音检测的跨声码器研究。程序。Interspeech 20141663-1667,doi:10.21437/Interspeech.2014-393

@进行中{sanchez14b_周间,author={乔恩·桑切斯(Jon Sanchez)、伊本·萨拉特萨加(Ibon Saratxaga)、英玛·赫内斯(Inma Hernaez)、埃娃·纳瓦斯(Eva Navas)和丹尼尔·埃罗(Daniel Error)},title={{使用相位信息进行非特定人合成语音检测的跨声码器研究}},年份=2014年,booktitle={Proc.Interspeech 2014},页数={1663--1667},doi={10.21437/Interspeech.2014-393},issn={2308-457X}}