{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部分”:[[2024,4,27]],“日期-时间”:“2024-04-27T18:30:53Z”,“时间戳”:17142653905},“引用-计数”:0,“发布者”:“人工智能发展协会(AAAI)”,“问题”:“2”,“内容域”:{“域”:[],“交叉标记限制”:false},“short container-title”:[“AAAI”],“抽象”:“在音频记录干净的受限场景下,视听声源定位任务得到了很好的研究。然而,在现实世界中,音频通常受到屏幕外声音和背景噪音的污染。它们会干扰识别所需声源和建立视觉-声音连接的过程,使之前的研究不适用。在这项工作中,我们提出了干扰橡皮擦(IEr)框架,该框架解决了野外视听声源定位问题。其关键思想是通过重新定义和雕刻有区别的音频表示来消除干扰。具体来说,我们观察到,由于音频信号的可加性,以前只学习单个音频表示的做法是不够的。因此,我们使用音频实例标识符模块扩展了音频表示,当不同音量的音频信号混合不均匀时,该模块可以清楚地区分声音实例。然后,我们通过具有跨模态蒸馏的跨模态Referrer模块来消除可听见但屏幕外的声音和无声但可见的物体的影响。定量和定性评估表明,我们的框架在声音定位任务上取得了优异的结果,尤其是在真实场景下<\/jats:p>“,”DOI“:”10.1609\/aaai.v36i2.20073“,”type“:”journal-article“,”created“:{”date-parts“:[[2022,7,4]],”date-time“:”2022-07-04T10:26:18Z“,”timestamp“:1656930378000},”page“:“:”10.1609“,”卷“:”36”,“作者”:[{“给定”:“西安”,“家庭”:“刘”,“序列”:“第一”,“从属关系”:[]},{“给出”:“瑞”,“家族”:“钱”,“顺序”:“附加”,“隶属关系”:[]}、{“指定”:“杭”,“家人”:“周”,“序号”:“额外”,“附属关系”:【】},{“给定”:“未耀”,“家族”:“林”,“序列”:“additional“,”affiliation“:[]},{“given”:“Ziwei”,“family”:“Liu”,“sequence”:“additional”,“affiliationation”:[]{“给定”:“Bolei”,”family“:”Zhou“,”sequence“:”additional 2,6,28]]},“集装箱标签”:[“AAAI人工智能会议记录“],“original-title”:[],“link”:[{“URL”:“https:\/\/ojs.AAAI.org\/index.php\/AAAI\/aarticle\/download\/20073\/19832”,“content-type”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“https:\/\/ojs.aaai.org\/index.php\/aaai\/article\/download\/20073\/19832“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2022,7,4],”date-time“:“2022-07-04T10:26:18Z”,”timestamp“:1656930378000},”score“:1,”resource“:”{“primary”:{“URL”:“”https:\/\/ojs.aaai.org\/index.php\/aaai\/article\/view\/20073“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[2022,6,28]]},“引用计数”:0,“日志发布”:{“发布”:“2”,“在线发布”:}“日期部分”:[2022,6,30]]}}、“URL”:“http://\/dx.doi.org\/10.10609 \/aaai.v36i2.20073“,”关系“:{},”ISSN“:[”2374-3468“,”2159-5399“],”ISSN-type“:[{”value“:”2374-3468“,”type“:“电子”},{“value”:“2159-5399”,“type”:”print“}],“subject”:[],“published”:{“date-parts”:[2022,6,28]]}}}