No More Mumbles: Enhancing Robot Intelligibility Through Speech Adaptation

Ren, Qiaoqiao; Hou, Yuanbo; Botteldooren, Dick; Belpaeme, Tony

不再有哑铃：通过语音自适应提高机器人的可懂度

乔乔任(根特大学),侯远波(根特大学),迪克·博特尔多伦(根特大学)和托尼·贝尔帕姆(根特大学)

(2024)IEEE机器人和自动化字母. 9(7).第6162-6169页

作者

任巧巧(根特大学),侯远波(根特大学),迪克·博特尔多伦(根特大学)和托尼·贝尔帕姆(根特大学)

组织

项目

2024年人工智能研究计划

摘要

口语交流是人际交往的核心，人们可以根据不同的个人和环境灵活地调整自己的语言。令人惊讶的是，机器人，以及其他数字设备，并没有配备适应其语音的设备，而是依赖于固定的语音参数，这通常会阻碍用户的理解。我们对39名参与者进行了一项言语理解研究，这些参与者暴露在不同的环境和语境条件下。在实验过程中，机器人使用不同的声音参数来表达单词，参与者的任务是识别所说的单词并评估他们对机器人语音的主观印象。实验的主要结果表明，声音质量好的空间与可懂度和用户体验正相关。然而，增加用户和机器人之间的距离会加剧用户体验，而分散注意力的背景声音会显著降低语音识别的准确性和用户满意度。接下来，我们为机器人构建了自适应语音。为此，机器人需要知道用户在特定环境下理解口语有多难。我们提出了一个预测模型，该模型评估了环境声学环境的恼人程度，以及在这种环境下理解某人的难度。然后，我们开发了一个卷积神经网络模型，以使机器人的语音参数适应不同的用户和空间，同时考虑到环境声学对可懂度的影响。最后，我们对27名用户进行了评估，与固定语音相比，自适应语音参数显示出更好的清晰度和用户体验。

关键词

神经网络,噪声,恢复,感知,俯仰（PITCH）,机器人,听觉系统,用户体验,任务分析,颗粒测量,噪声测量,大气测量,以人为中心的机器人,设计和人为因素,社会HRI

下载

下载

DS765符合pdf
- 全文
- |
- 开放存取
- |
- PDF格式
- |
- 1.86 MB
下载

（…）.pdf格式
- 全文
- |
- 仅UGent
- |
- PDF格式
- |
- 1.01 MB

引用

请使用此url引用或链接到此出版物：http://hdl.handle.net/1854/LU-01J0JSHMSGVJ81R3HF2JXFA6SS

MLA公司: 任巧巧等，“不再有哑铃：通过语音适应提高机器人的可懂度。”IEEE机器人和自动化字母，第9卷，第7号，IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC，2024年，第6162–69页，doi:10.1109/LRA.2024.340117。
亚太地区: Ren，Q.，Hou，Y.，Botteldooren，D.，&Belpaeme，T.（2024）。不再有Mumbles:通过语音自适应增强机器人的可理解性。IEEE机器人与自动化信函,9(7), 6162–6169. https://doi.org/10.109/LRA.2024.340117
芝加哥作者日期: 任正非、乔乔、侯远波、迪克·博特尔多伦和托尼·贝尔佩姆。2024.“不再有哑铃：通过语音自适应提高机器人的可懂度。”IEEE机器人和自动化字母9 (7): 6162–69. https://doi.org/10.109/LRA.2024.340117。
芝加哥作者日期（所有作者）: 任正非、乔乔、侯远波、迪克·博特尔多伦和托尼·贝尔佩姆。2024.“不再有哑铃：通过语音自适应提高机器人的可懂度。”IEEE机器人和自动化字母9 (7): 6162–6169. doi:10.1109/LRA.2024.3401117。
温哥华: 1
Ren Q，Hou Y，Botteldooren D，Belpaeme T。不再发出哑铃声：通过语音自适应提高机器人的可懂度。IEEE机器人与自动化信函，2024年；9(7):6162–9.
电气与电子工程师协会: [1]
Q.Ren、Y.Hou、D.Botteldooren和T.Belpaeme，“不再有哑铃：通过语音适应提高机器人的可识别性，”IEEE机器人和自动化字母第9卷，第7期，第6162–6169页，2024年。

@文章{01J0JSHMSGVJ81R3HF2JXFA6SS，抽象={{口语交流是人际交流的核心，人们可以灵活地根据不同的个人和环境调整自己的语言。令人惊讶的是，机器人以及其他数字设备没有配备来调整自己的语音，而是依赖于固定的语音参数，这往往会妨碍用户。我们对39名参与者进行了一项言语理解研究，这些参与者暴露在不同的环境和语境条件下。在实验过程中，机器人使用不同的声音参数来表达单词，参与者的任务是识别所说的单词并评估他们对机器人语音的主观印象。实验的主要结果表明，声音质量好的空间与可懂度和用户体验正相关。然而，增加用户与机器人之间的距离会加剧用户体验，而分散背景声音会显著降低语音识别准确性和用户满意度。接下来，我们为机器人构建了自适应语音。为此，机器人需要知道用户在特定环境下理解口语有多难。我们提出了一个预测模型，该模型评估了环境声学环境的恼人程度，以及在这种环境下理解某人的难度。然后，我们开发了一个卷积神经网络模型，以使机器人的语音参数适应不同的用户和空间，同时考虑到环境声学对可懂度的影响。最后，我们对27个用户进行了评估，与固定语音相比，自适应语音参数具有更好的清晰度和用户体验，author={{Ren，Qiaociao and Hou，Yuanbo and Botteldooren，Dick and Belpaeme，Tony}}，issn={{2377-3766}}，journal={{IEEE机器人和自动化字母}}，keywords={{神经网络、噪声、反扰、感知、俯仰、机器人、听觉系统、用户体验、任务分析、粒子测量、噪声测量、大气测量、以人为本的机器人、设计和人为因素、社会HRI}}，语言={{eng}}，数字={{7}}，pages＝{{6162-6169}｝，publisher={{IEEE-INST电气电子工程师有限公司}}，title={{不再有哑铃：通过语音自适应提高机器人的可懂度}}，url={http://doi.org/10.109/LRA.2024.3401117}}，体积={{9}}，年份={2024}}，}

海拔高度: 在Altmetric中查看
科学网: 引用次数：

学术参考书目

不再有哑铃：通过语音自适应提高机器人的可懂度

下载

引用

目录

支持

联系人