标题 |
改进说话人日记工具的策略 |
作者 |
大卫·塔瓦雷斯,伊娃·纳瓦斯,丹尼尔·埃罗和伊本·萨拉特萨加 |
摘要 |
本文描述了使用Albayzin 2010日记数据库改进离线说话人日记工具所获得结果的不同策略。对系统产生的误差进行了分析,并提出了不同的策略来减少各种误差。错误标记的极短片段和用不同标识符标记的一个说话者的不同外观是最常见的错误。为了处理这些错误,我们构建了一个后处理模块,该模块通过重新训练相关说话人的GMM模型来细化分段。该后处理模块已与训练数据集进行了调整,并在测试数据集中将日记系统的结果提高了16.4%。 |
话题 |
人员标识,工具、系统、应用程序,其他 |
全文 |
改进说话人日记工具的策略 |
Biptex公司 |
@会议记录{TAVAREZ12.711, 作者={David Tavarez和Eva Navas以及Daniel Erro和Ibon Saratxaga}, title={改进说话人日记工具的策略}, booktitle={第八届国际语言资源与评价会议(LREC'12)会议记录}, 年份={2012}, 月={may}, 日期={23-25}, address={土耳其伊斯坦布尔}, editor={尼科莱塔·卡尔佐拉里(会议主席)、哈立德·乔克里(Khalid Choukri)、蒂埃里·德克勒克(Thierry Declerck)、梅赫迈特·乌尔·多安(Mehmet Uur Doan)、本特·马加德(Bente Maegaard)、约瑟夫·马里亚尼(Joseph Mariani)、亚松森·莫雷诺(Asuncion Moreno)、扬·奥迪克(Jan Odijk)和斯特利奥斯·皮普利迪斯, publisher={欧洲语言资源协会(ELRA)}, isbn={978-2-9517408-7-7}, 语言={英语} } |