DCASE 2019,美国纽约州纽约市
迈克尔·曼德尔 , 贾斯汀·萨拉蒙 , 丹尼尔·P·W·埃利斯 :
2019年声学场景和事件检测和分类研讨会论文集(DCASE 2019),美国纽约大学,2019年10月。 2019 ,十亿 978-0-578-59596-2 雅各布·阿贝尔 , 马可·哥茨 , 托比亚斯·克劳 , 多米尼克·扎普夫 , 克里斯蒂安·库恩 , 汉娜·卢卡舍维奇 , 斯蒂芬妮·库伦茨 , Stylianos I.米米拉基斯 :
Stadtlärm项目中的城市噪声监测——现场报告。 1-4 赛纳斯·阿达帕 :
基于卷积神经网络的城市声音标记。 5-9 莎拉·阿达瓦内 , 大主教Politis , Tuomas Virtanen公司 :
用于声音事件定位和检测的多房间混响数据集。 10-14 莎拉·阿达瓦内 , 海瑟姆·M·费耶克 , 弗拉基米尔·图尔巴宾 :
弱标记数据的声音事件分类和检测。 15-19 莎拉·阿达瓦内 , Archontis政治 , Tuomas Virtanen公司 :
基于卷积递归神经网络的多运动声源定位、检测和跟踪。 20-24 秋山修(Osamu Akiyama) , 佐藤纯弥 :
DCASE 2019任务2:用于音频标记的多任务学习、半监督学习和模型集成。 25-29 殷草 , 孔秋强 , 图拉布·伊克巴尔 , 凤眼安 , 王文武 , Mark D.Plumbley公司 :
使用两阶段策略的合成音事件检测和定位。 30-34 马克·卡特赖特 , 安娜·埃利萨·门德斯·门德斯 , 杰森·克莱默 , 文森特·洛斯坦伦 , 格雷厄姆·多夫 , 胡洪武(Ho-Hsiang Wu) , 贾斯汀·萨拉蒙 , 奇怪的11月 , 胡安·巴勃罗·贝洛 :
SONYC城市声音标记(SONYC-UST):来自城市声传感器网络的多标签数据集。 35-39 Teck Kai Chan公司 , 程宗钦 , 叶莉 :
用于声音事件检测的非负矩阵分解-进化神经网络(NMF-CNN)。 40-44 赵章宏(Janghoon Cho) , 桑格拉克·云 , Hyongwoo公园 , Jungyun Eum公司 , Kyuwoong Hwang公司 :
基于大边缘分解CNN的声场景分类。 45-49 桑提里奥斯(Sotirios Panagiotis Chytas) , Gerasimos Potamianos公司 :
基于自适应阈值卷积神经网络的声音事件分层检测及其定位。 50-54 Héctor A.Cordourier公司 , 保罗·洛佩斯·梅耶 , 乔纳森·黄 , 胡安·德尔·霍约·昂蒂弗罗斯 , 洪路 :
GCC-PHAT在多个房间同时进行声音事件定位和检测(SELD)的交叉相关音频功能。 55-58 康斯坦蒂诺斯·德罗索斯 , 沙扬·加里布 , 保罗·马格伦 , Tuomas Virtanen公司 :
基于教师强制和定时采样的声音事件检测语言建模。 59-63 珍妮克·埃伯斯 , Reinhold Häb-Umbach公司 :
卷积递归神经网络和数据增强用于带有噪声标签和最小监督的音频标签。 64-68 爱德华多·丰塞卡 , 马诺伊·普拉卡尔 , Frederic字体 , 丹尼尔·P·W·埃利斯 , 泽维尔·塞拉 :
带有噪音标签和最小监督的音频标签。 69-73 Ritwik Giri公司 , 阿文德·克里希纳斯瓦米 , 卡里姆·赫尔瓦尼 :
用于声学新颖性检测的鲁棒非负块稀疏编码。 74-78 马克·C·格林 , 达米安·T·墨菲 :
使用峰值聚类的环境音频中的声源定位。 79-83 弗朗索瓦·格隆丁 , 伊沃娜·索比埃拉(Iwona Sobieraj) , Mark D.Plumbley公司 , 詹姆斯·格拉斯 :
在成对麦克风上使用CRNN进行声音事件定位和检测。 84-88 何可欣 , 沈玉涵 , 张伟强 :
多神经网络集成方法用于带噪声标签和最小监督的音频标记。 89-93 乔纳森·黄 , 洪路 , 保罗·洛佩斯·梅耶 , 赫克托·科杜里尔 , 胡安·德尔·霍约·昂蒂弗罗斯 :
使用基于深度学习的集成平均法进行声场景分类。 94-98 池川昭 , Kunio Kashino公司 :
基于条件序列-序列模型的神经音频字幕。 99-103 Keisuke Imoto公司 , 小野信孝 :
RU 2019年多声道家用声学场景:由具有各种特性的分布式麦克风记录的多声道数据集。 104-108 井上达那布 , Phongtharin Vinayavekhin公司 , 王世强 , 大卫·伍德 , 阿西姆·穆纳瓦尔 , Bong Jun Ko公司 , 南希·格雷科 , Ryuki Tachibana公司 :
用于环境声音分类的乱序和混合数据增强。 109-113 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 沈惠珍 , 哈金于 :
提取声学场景分类中专家深度神经网络的知识。 114-118 斯拉沃米尔·卡普卡 , 马特乌什·莱万多夫斯基 :
使用连续集成的CRNN模型进行声源检测、定位和分类。 119-123 哈立德·库蒂尼 , 哈米德·埃赫巴尔·扎德 , 格哈德·维德默 :
用于声学场景分类的接收现场正则CNN变体。 124-128 Wootaek Lim公司 :
使用卷积递归神经网络集成增强家用环境中的声音事件检测。 129-133 林利伟(Liwei Lin) , 王向东 , 刘洪(音) , 钱月良 :
DCASE 2019任务4的引导学习卷积系统。 134-138 塞缪尔·利平 , 康斯坦蒂诺斯·德罗索斯 , Tuomas Virtanen公司 :
众包音频字幕数据集。 139-143 文森特·洛斯塔伦 , 凯特林·帕尔默 , 伊利骑士 , 克里斯托弗·克拉克 , 霍尔格·克林克 , 安德鲁·范斯沃思 , 蒂娜·王 , 杰森·克莱默 , 胡安·巴勃罗·贝洛 :
基于跨通道能量归一化的生物声事件长距离检测。 144-148 罗希斯·马尔斯 , 普拉内·普拉蒂克 , 斯里坎思·纳吉塞蒂 , 林崇顺 :
基于卷积神经网络的双耳信号声场景分类。 149-153 卢卡·马佐恩 , 小泉由马 , 安田正弘 , 原田信夫 :
基于DNN的波达方向估计的一阶环境域空间增强。 154-158 马尔滕·迈尔 , 彼得·卡尔斯梅克斯 , Lode Vuegen公司 :
缺失标签和重叠声音事件对声音事件分类的多标签多实例学习的影响。 159-163 安娜玛丽亚·梅萨罗斯 , 托尼·海托拉 , Tuomas Virtanen公司 :
DCASE 2019挑战赛中的声场景分类:闭集和开集分类和数据不匹配设置。 164-168 马克斯·莫里森 , 布莱恩·帕尔多 :
OtoMechanic:通过查询示例进行汽车听觉诊断。 169-173 埃里克·尼克尔斯 , 丹尼尔·汤普金 , 范建宇 :
分级声音事件分类。 248-252 Arjun Pankajakshan先生 , 海伦·L·熊 , 埃马努伊尔·贝内托斯 :
开始、活动和事件:复调声音事件建模的多任务方法。 174-178 Sooyoung公园 :
基于网格网的结构,用于具有重组学习的声音事件定位和检测。 179-183 Hyongwoo公园 , 桑格拉克·云 , Jungyun Eum公司 , 赵章宏(Janghoon Cho) , Kyuwoong Hwang公司 :
使用三训练和对抗学习的弱标记声音事件检测。 184-188 安德烈斯·佩雷斯·洛佩斯 , 爱德华多·丰塞卡 , 泽维尔·塞拉 :
一种用于声音事件定位和检测的混合参数深度学习方法。 189-193 Fatemeh Pishdadian公司 , 普雷姆·西塔拉曼 , Bongjun Kim先生 , 布莱恩·帕尔多 :
非言语人声的分类:深度与信号处理表现。 194-198 普拉内·普拉蒂克 , 文杰洁 , 斯里坎特·纳吉塞蒂 , 罗希斯·马尔斯 , 林崇顺 :
使用CRNN架构和用于模型泛化的混合进行声音事件定位和检测。 199-203 保罗·普里默斯 , 哈米德·埃赫巴勒·扎德 , 大卫·艾特塞布纳 , 哈立德·库蒂尼 , 安德烈亚斯·阿尔斯特 , 格哈德·维德默 :
在基于CNN的声场景分类中利用并行录音增强设备不变性。 204-208 严酷的普洛希特 , Ryo Tanabe先生 , 一芝武史 , 内藤隆(Takashi Endo) , 二阶由纪夫 , Kaori Suefusa公司 , 川口优平 :
MIMII数据集:用于故障工业机器调查和检查的声音数据集。 209-213 里沙布·兰扬 , 萨蒂什·贾亚巴兰 , Thi Ngoc Tho Nguyen先生 , Woon Seng Gan先生 :
使用残差网络和递归神经网络的声音事件检测和到达方向估计。 214-218 法特梅·萨基 , 郭银一 , 程玉红 , 金丽勋(Lae-Hoon Kim) , 满语德什潘德 , Sunkuk Moon公司 , 恩景岛 , 埃里克·维瑟 :
开放式进化声学场景分类系统。 219-223 自强市 , 刘刘 , 林惠斌 , 刘如杰 , 安岩市 :
HODGEPODGE:基于半监督学习方法集成的声音事件检测。 224-228 阿什迪普·辛格 , 帕德马纳班·拉詹 , 阿纳夫·巴夫萨尔 :
声音场景分类原始音频的深度多视图功能。 229-233 舒布赫·辛格 , 阿琼·潘卡雅克珊 , 埃马努伊尔·贝内托斯 :
使用线性噪声建模层的音频标记。 234-238 Vinod Subramanian公司 , 埃马努伊尔·贝内托斯 , 马克·桑德勒 :
声音事件分类中对抗攻击的稳健性。 239-243 Yui Sudo(音译) , 伊藤胜胜 , 西田贤治 , 中田和弘 :
在声事件定位和检测中使用四元数输出改进DOA估计。 244-247 尼古拉斯·特保尔 , 罗曼·塞里泽尔 , 贾斯汀·萨拉蒙 , Ankit Parag Shah公司 :
具有弱标记数据的家庭环境中的声事件检测和声景合成。 253-257 凯文·威尔金霍夫 , 弗兰克·库思 :
用深度卷积自动编码器进行开集声场景分类。 258-262 巴勃罗·齐尼马纳斯 , 巴勃罗·坎塞拉 , 马丁·罗卡莫拉 :
MAVD:城市环境中声音事件检测的数据集。 263-267