国际标准协会 档案文件 2005年国际演讲
国际标准协会 档案文件 2005年国际演讲

说话人识别中基于回归树的最优模型阶数选择

张世磊、白俊梅、张淑武、徐波

本文提出了一种在文本相关说话人识别系统中基于回归树的高斯混合说话人模型(GMM)初始化中选择最佳模型阶数的新方法。其目标是根据贝叶斯信息准则(BIC)和凝聚聚类,选择最佳分量数,以充分建模说话人,获得良好的说话人识别性能。这种方法的一个明显优点是,它提供了一个灵活的框架,可以根据每个客户演讲者的训练数据选择最佳的演讲者模型顺序。在YOHO语料库上的实验结果表明,自适应模型混合组件取得了更好的性能,特别是考虑到不同的说话人具有不同数量的可用注册数据。


doi:10.21437/Interspeech.2005-639

引用为:Zhang,S.,Bai,J.,Zhang、S.,Xu,B.(2005)说话人识别中基于回归树的最优模型顺序选择。程序。Interspeech 20052045-2048,doi:10.21437/Interspeech.2005-639

@在过程中{zhang05f_enterseech,author={Shilei Zhang和Junmei Bai,Shuwu Zhang and Bo Xu},title={{说话人识别中基于回归树的最优模型顺序选择}},年份=2005,booktitle={Proc.Interspeech 2005},页数={2045--2048},doi={10.21437/Interspeech.2005-639},issn={2958-1796}}