张宣凯在IEEE的自动语音识别和理解研讨会上获得最佳论文奖

2020年1月9日

张玄凯(音),研究生电气与计算机工程系他也是语言和语音处理中心,承认他没有太多考虑在IEEE的自动语音识别和理解研讨会在新加坡。

尽管被提名为该奖项,并在整个会议期间收到了与会者的大量积极反馈,但最高荣誉的争夺仍在激烈进行。他希望他的论文《Mimo-Speech:端到端多通道多扬声器语音识别》能获得大会最佳学生论文奖。

当颁奖典礼宣布时,张艺谋有点沮丧,因为他的名字没有被提名为最佳学生论文奖。然而,这种失望是短暂的,就在几分钟后,有消息透露,他的论文没有获得最佳学生论文奖,因为它被选为研讨会的最佳综合论文。

“我很惊讶地听到我的论文的标题,”张说道。

Chang的论文致力于解决鸡尾酒会问题,即目标说话人的讲话与干扰说话人发出的噪音纠缠在一起。从本质上讲,当一个区域出现其他破坏性声音时,能够清晰地听和理解语音。

从历史上看,机器在理想的无噪音条件下的语音识别任务中表现优于人类。然而,当有令人分心的声音时,人类可以轻松处理此类情况,而机器则无法处理。Chang的研究反映了一种新技术,可以帮助机器在该领域赶上人类。

张说:“在我们的论文中,我们提出了一种新的模型,利用麦克风阵列信号来识别多个扬声器同时讲话的语音信号,并取得了令人惊讶的好结果。”。“我们的工作可以用于提高语音识别系统在现实生活中常见的复杂情况下的性能,例如智能家居设备或会议转录系统。”

张认为,该奖项标志着该领域的其他人接受了他所做的工作。他希望他的工作能让人们更多地关注鸡尾酒会问题,并且希望他的方法能在使用智能设备和助听器时带来更好的体验。

至于他的未来工作,他提到在约翰霍普金斯大学工作是“这项研究的关键”

张说:“当我开始与约翰霍普金斯大学的团队合作时,我就开始了这个项目的工作。”。“在整个项目中,我与我的顾问(欧洲经委会副研究教授)进行了很多有价值的讨论渡边信治,以及我们组中以及CLSP中的其他朋友。甚至在参加会议之前,他们就如何改进我的演讲给了我有益的建议。我感谢他们在这一过程中给予我的所有帮助和指导。”

类别:

语言和语音处理中心