萨米尔·库拉纳
人员信息
优化列表
2020年–今天
2024 [i20] 吉木正山 , 戈登·威彻恩 , 弗朗索瓦·日尔曼 , 潘泽旭 , 萨米尔·库拉纳 , Chiori Hori公司 , 乔纳森·勒鲁 以下为:
NIIRF:用于HRTF上采样和个性化的神经IIR滤波器字段。 CoRR公司 abs/2402.17907 ( 2024 ) [i19] 古正贤(Junghyun Koo) , 戈登·威彻恩 , 弗朗索瓦·日尔曼 , 萨米尔·库拉纳 , 乔纳森·勒鲁 以下为:
SMITIN:世代音乐变形金刚的自我监控推理时间创新。 CoRR公司 abs/2404.02252 ( 2024 ) 2023 [j3] 维多利亚·明戈特 , 巴勃罗·吉梅诺 , 路易斯·文森特 , 萨米尔·库拉纳 , 安托万·洛朗 , 杰罗德·杜雷特 以下为:
使用声学单元的直接文本到语音翻译系统。 IEEE信号处理。 莱特。 30 以下为: 1262-1266 ( 2023 ) [第16条] 潘泽旭 , 戈登·威彻恩 , 吉木正山 , 弗朗索瓦·日尔曼 , 萨米尔·库拉纳 , Chiori Hori公司 , 乔纳森·勒鲁 以下为:
用于目标语音提取的场景感知视听TF网格。 ASRU公司 2023 以下为: 1-8 [第15条] 诺曼·达瓦拉塔巴德 , 萨米尔·库拉纳 , 安托万·洛朗 , 詹姆斯·格拉斯 以下为:
无监督不确定驱动语音伪标签滤波与模型校正。 ICASSP公司 2023 以下为: 1-5 [第14条] 安托万·洛朗 , 苏希尔·加比奇 , Ha Nguyen先生 , 哈伦·埃卢奇 , 费蒂·布加雷斯 , 安托万硫醇 , 雨果·里吉德尔 , 萨利马·姆达法尔 , 盖尔·拉佩里埃 , 卢卡斯·梅森 , 萨米尔·库拉纳 , Yannick Estève公司 以下为:
用于IWSLT 2023方言和低资源语音翻译任务的ON-TRAC联盟系统。 ACL处的IWSLT 2023 以下为: 219-226 [i18] 安德鲁·鲁迪琴科 , 萨米尔·库拉纳 , 塞缪尔·托马斯 , 罗杰里奥·费利斯 , 列奥尼德·卡林斯基 , 希尔德·奎恩 , 大卫·哈瓦特 , 布莱恩·金斯伯里 , 詹姆斯·格拉斯 以下为:
多语言自我监督和弱监督言语训练对未知语言适应的比较。 CoRR公司 abs/2305.12606 ( 2023 ) [i17] 萨米尔·库拉纳 , 诺曼·达瓦拉塔巴德 , 安托万·洛朗 , 路易斯·文森特 , 巴勃罗·吉梅诺 , 维多利亚·明戈特 , 詹姆斯·格拉斯 以下为:
用于自动语音翻译的改进的跨语言迁移学习。 CoRR公司 abs/2306.00789 ( 2023 ) [i16] 袁巩 , 萨米尔·库拉纳 , 列奥尼德·卡林斯基 , 詹姆斯·格拉斯 以下为:
耳语:噪音抑制自动语音识别器也是强大的通用音频事件标记器。 CoRR公司 abs/2307.03183 ( 2023 ) 【i15】 维多利亚·明戈特 , 巴勃罗·吉梅诺 , 路易斯·文森特 , 萨米尔·库拉纳 , 安托万·洛朗 , 杰罗德·杜雷特 以下为:
使用声学单元的直接文本到语音翻译系统。 CoRR公司 abs/2309.07478 ( 2023 ) [第14条] 迪米特里奥斯·布拉里奥斯 , 戈登·威彻恩 , 弗朗索瓦·日尔曼 , 潘泽旭 , 萨米尔·库拉纳 , Chiori Hori公司 , 乔纳森·勒鲁 以下为:
生成或复制:听诊音频潜在扩散模型。 CoRR公司 abs/2310.10604 ( 2023 ) [i13] 潘泽旭 , 戈登·威彻恩 , 吉木正山 , 弗朗索瓦·日尔曼 , 萨米尔·库拉纳 , Chiori Hori公司 , 乔纳森·勒鲁 以下为:
用于目标语音提取的场景软件视听TF-GridNet。 CoRR公司 abs/2310.19644 ( 2023 ) [i12] 潘泽旭 , 戈登·威彻恩 , 弗朗索瓦·日尔曼 , 萨米尔·库拉纳 , 乔纳森·勒鲁 以下为:
NeuroHeed+:通过联合听觉注意检测改进神经系统说话人提取。 CoRR公司 abs/2312.07513 ( 2023 ) 2022 [注2] 萨米尔·库拉纳 , 安托万·洛朗 , 詹姆斯·格拉斯 以下为:
SAMU-XLSR:语义对齐的多模态语言级跨语言语音表示。 IEEE J.选择。 顶部。 信号处理。 16 ( 6 ) 以下为: 1493-1504 ( 2022 ) [第13条] 诺曼·达瓦拉塔巴德 , 袁巩 , 萨米尔·库拉纳 , 罗达金 , 詹姆斯·格拉斯 以下为:
从长期神经心理学访谈中发现痴呆症。 EMNLP(调查结果) 2022 以下为: 5270-5283个 [c12] 萨米尔·库拉纳 , 安托万·洛朗 , 詹姆斯·格拉斯 以下为:
单语Wav2vec-2.0跨语言改编的魔法之尘。 ICASSP公司 2022 以下为: 6647-6651 [i11] 袁巩 , 萨米尔·库拉纳 , 安德鲁·鲁迪森科 , 詹姆斯·格拉斯 以下为:
CMKD:CNN/基于变换器的音频分类跨模型知识提取。 CoRR公司 abs/2203.06760 ( 2022 ) [i10] 萨米尔·库拉纳 , 安托万·洛朗 , 詹姆斯·格拉斯 以下为:
SAMU-XLSR:语义对齐的多模态语言级跨语言语音表示。 CoRR公司 abs/2205.08180 ( 2022 ) [第九章] 诺曼·达瓦拉塔巴德 , 萨米尔·库拉纳 , 安托万·洛朗 , 詹姆斯·格拉斯 以下为:
关于无监督不确定性驱动的语音伪标签滤波和模型校准。 CoRR公司 abs/2211.07795 ( 2022 ) 2021 [第11条] 萨米尔·库拉纳 , 尼科·莫里茨 , 高崎县 , 乔纳森·勒鲁 以下为:
通过不确定性驱动的自我训练实现语音识别的无监督域自适应。 ICASSP公司 2021 以下为: 6553-6557 [第10条] 程毅Jeff Lai , 杨章 , 亚历山大·H·刘 , Shiyu Chang先生 , 廖益伦 , 容松庄 , 钱凯志 , 萨米尔·库拉纳 , 大卫·D·考克斯 , 吉姆·格拉斯 以下为:
PARP:自我监督语音识别的删减、调整和重新运行。 NeurIPS公司 2021 以下为: 21256-21272 [i8] 程一杰·赖 , 杨章 , 亚历山大·H·刘 , Shiyu Chang先生 , 廖益伦 , 容松庄 , 钱凯志 , 萨米尔·库拉纳 , 大卫·D·考克斯 , 詹姆斯·格拉斯 以下为:
PARP:自我监督语音识别的删减、调整和重新运行。 CoRR公司 abs/2106.05933 ( 2021 ) [i7] 萨米尔·库拉纳 , 安托万·洛朗 , 詹姆斯·格拉斯 以下为:
魔尘用于单语wav2vec-2.0的跨语言适应。 CoRR公司 abs/2110.03560 ( 2021 ) 2020 【c9】 阿德里安·兰库基 , 扬·乔洛夫斯基 , 纪尧姆·桑切斯 , 里卡德·马塞尔 , 陈南欣 , Hans J.G.A.玩偶 , 萨米尔·库拉纳 , Tanel Alumäe公司 , 安托万·洛朗 以下为:
矢量量化瓶颈模型的稳健训练。 国际JCNN 2020 以下为: 1-7 【c8】 萨米尔·库拉纳 , 安托万·洛朗 , 徐伟宁 , 扬·乔洛夫斯基 , 阿德里安·兰库基 , 里卡德·马塞尔 , 詹姆斯·格拉斯 以下为:
一种用于无监督语音表示学习的卷积深度马尔可夫模型。 INTERSPEECH公司 2020 以下为: 3790-3794 [i6] 阿德里安·兰库基 , 扬·乔洛夫斯基 , 纪尧姆·桑切斯 , 里卡德·马塞尔 , 陈南欣 , Hans J.G.A.玩偶 , 萨米尔·库拉纳 , Tanel Alumäe公司 , 安托万·洛朗 以下为:
矢量量化瓶颈模型的稳健训练。 CoRR公司 abs/2005.08520 ( 2020 ) [i5] 萨米尔·库拉纳 , 安托万·洛朗 , 徐伟宁 , 扬·乔洛夫斯基 , 阿德里安·兰库基 , 里卡德·马塞尔 , 詹姆斯·格拉斯 以下为:
一种用于无监督语音表示学习的卷积深度马尔可夫模型。 CoRR公司 abs/2006.02547 ( 2020 ) [i4] 萨米尔·库拉纳 , 安托万·洛朗 , 詹姆斯·格拉斯 以下为:
CSTNet:用于自我监督语音表征学习的对比语音翻译网络。 CoRR公司 abs/2006.02814 ( 2020 ) [i3] 萨米尔·库拉纳 , 尼科·莫里茨 , 高崎县 , 乔纳森·勒鲁 以下为:
通过不确定性驱动的自我训练实现语音识别的无监督域自适应。 CoRR公司 abs/2011.13439 ( 2020 )
2010 – 2019
2019 【c7】 萨米尔·库拉纳 , 沙菲克·雷汉·乔蒂 , 艾哈迈德·阿里 , 詹姆斯·格拉斯 以下为:
无监督无纠缠表征语音学习的因子深马尔可夫模型。 ICASSP公司 2019 以下为: 6540-6544 [i2] 萨米尔·库拉纳 , 艾哈迈德·阿里 , 詹姆斯·格拉斯 以下为:
DARTS:阿拉伯语方言转录系统。 CoRR公司 abs/1909.12163 ( 2019 ) 2018 [j1] 萨米尔·库拉纳 , 雷达·拉维 , 哈立德·昆吉 , Gwo-Yu Chuang先生 , 哈利玛·本斯梅尔 , Raghvendra购物中心 以下为:
DeepSol:基于序列的蛋白质溶解度预测的深度学习框架。 生物信息。 34 ( 15 ) 以下为: 2605-2613 ( 2018 ) 【c6】 玛丽亚姆·纳贾菲安 , 萨米尔·库拉纳 , Suwon Shon先生 , 艾哈迈德·阿里 , 詹姆斯·格拉斯 以下为:
利用卷积神经网络进行基于语音的方言识别。 ICASSP公司 2018 以下为: 5174-5178 2017 【c5】 法希姆·达维 , 张一凡 , 萨米尔·库拉纳 , 纳迪尔·杜拉尼 , 哈桑·萨贾德 , 艾哈迈德·阿卜杜拉利 , 哈米·穆巴拉克 , 艾哈迈德·阿里 , 斯蒂芬·沃格尔 以下为:
QCRI实时语音翻译系统。 EACL(软件演示) 2017 以下为: 61-64 【c4】 雷纳斯利宾 , 乌尔里希·格尔曼 , 冈蒂斯·巴兹丁斯 , 亚历山大·伯奇 , 史蒂夫·雷纳斯 , 苏珊娜·韦伯 , 佩吉·范德克雷夫特 , 埃尔维·布拉德 , 乔·普列托 , 昂德雷·克莱奇 , 彼得·贝尔 , 亚历山大·拉扎里迪斯 , 阿方索·门德斯 , 塞巴斯蒂安·里德尔 , 马里亚纳S.C.阿尔梅达 , 佩德罗·巴拉奇 , 谢·科恩(Shay B.Cohen) , 托马斯·德沃贾克 , 菲利普·加纳 , 安德烈亚斯·吉弗 , 马金·朱奇斯·道蒙特 , 希娜·伊姆兰 , 大卫·诺盖拉 , 艾哈迈德·阿里 , 塞巴斯蒂奥·米兰达 , 安德烈·波佩斯库·贝利斯 , 莱斯利·米库利奇·沃伦 , 尼科斯·帕帕萨兰托普洛斯 , 阿比奥拉·奥巴穆伊德 , 克莱夫·琼斯 , 法希姆·达维 , 安德烈亚斯·弗拉科斯 , 杨旺(Yang Wang) , 斯博通(Sibo Tong) , 里科·森里奇 , 尼古拉斯·帕帕斯 , 沙希·纳拉扬 , 马可·达蒙特 , 纳迪尔·杜拉尼 , 萨米尔·库拉纳 , 艾哈迈德·阿卜杜拉利 , 哈桑·萨贾德 , 斯蒂芬·沃格尔 , 大卫·谢佩 , 克里斯·埃尔农 , 杰夫·米切尔 以下为:
SUMMA平台原型。 EACL(软件演示) 2017 以下为: 116-119 【c3】 萨米尔·库拉纳 , 玛丽亚姆·纳贾菲安 , 艾哈迈德·阿里 , 图卡·哈奈 , 约纳坦·贝林科夫 , 詹姆斯·格拉斯 以下为:
QMDIS:QCRI-MIT高级方言识别系统。 INTERSPEECH公司 2017 以下为: 2591-2595 2016 [c2] 艾哈迈德·阿里 , 纳吉姆·德哈克 , 帕特里克红衣主教 , 萨米尔·库拉纳 , Sree Harsha Yella公司 , 詹姆斯·格拉斯 , 彼得·贝尔 , 史蒂夫·雷纳斯 以下为:
阿拉伯语广播语音中的自动方言检测。 INTERSPEECH公司 2016 以下为: 2934-2938 【c1】 萨米尔·库拉纳 , 艾哈迈德·阿里 以下为:
用于阿拉伯多方言广播媒体识别的QCRI高级转录系统(QATS):MGB-2挑战。 SLT公司 2016 以下为: 292-298 [i1] 萨米尔·库拉纳 , 艾哈迈德·阿里 , 史蒂夫·雷纳斯 以下为:
阿拉伯语广播语音方言识别的多视角降维方法。 CoRR公司 abs/1609.05650 ( 2016 )