巴里·约翰·西奥博尔德
人员信息
优化列表
2020年–今天
2024 [公元47年] 凯瑟琳·梅特卡夫 , 米盖尔·萨拉比亚 , 马萨·费德切基纳 , 巴里·约翰·西奥博尔德 :
在基于偏好的强化学习中,你能依赖合成标签吗? 这很复杂。 AAAI公司 2024 : 10128-10136 [公元46年] 濑户斯凯勒 , 巴里·约翰·西奥博尔德 , 费德里科·达涅利 , 纳维德普·贾特利 , 丹·布斯布里奇 :
REALM:用于改进单样本测试时间自适应的鲁棒熵自适应损失最小化。 WACV(加权平均值) 2024 : 2051-2060 【i21】 郑哲文(Jee-weon Jung) , 张望友 , 加通石 , 扎卡里亚·阿尔德涅 , Takuya Higuchi先生 , 巴里·约翰·西奥博尔德 , 艾哈迈德·胡森·阿卜杜拉齐兹 , 渡边信治 :
ESPnet-SPK:全流水线扬声器嵌入工具包,具有可复制的食谱、自我监督的前端引擎和离线模型。 CoRR公司 abs/2401.17230 ( 2024 ) [i20] 扎卡里亚·奥尔德内 , Higuchi Takuya , 郑哲文(Jee-weon Jung) , 斯凯勒·塞托 , 塔蒂亚娜·利霍马连科 , 斯蒂芬·舒姆 , 艾哈迈德·胡森·阿卜杜拉齐兹 , 渡边信治 , 巴里·约翰·西奥博尔德 :
你能去掉带有自我监督语音特征的说话人识别的下游模型吗? CoRR公司 abs/2402.00340 ( 2024 ) [i19] 凯瑟琳·梅特卡夫 , 米盖尔·萨拉比亚 , 娜塔莉·麦克拉兹 , 巴里·约翰·西奥博尔德 :
基于示例的高效偏好强化学习和动态感知奖励。 CoRR公司 abs/2402.17975 ( 2024 ) 2023 [公元45年] 凯瑟琳·梅特卡夫 , 米盖尔·萨拉比亚 , 娜塔莉·麦克拉兹 , 巴里·约翰·西奥博尔德 :
基于示例的高效偏好强化学习和动态感知奖励。 CoRL公司 2023 : 1484-1532 [公元44年] 扎卡里亚·阿尔德涅 , 马萨·费德切基纳 , 斯凯勒·塞托 , 凯瑟琳·梅特卡夫 , 米盖尔·萨拉比亚 , 尼古拉斯·阿波斯托洛夫 , 巴里·约翰·西奥博尔德 :
LIP发音在视觉言语感知中的作用。 ICASSP公司 2023 : 1-5 [公元43年] 特里沙·米塔尔 , 扎卡里亚·阿尔德涅 , 马萨·费德切基纳 , 阿努拉·兰扬 , 巴里·约翰·西奥博尔德 :
基于语音的自然主义头部运动生成。 ICASSP公司 2023 : 1-5 [i18] 米盖尔·萨拉比亚 , 埃琳娜·梅尼亚连科 , 亚历山德罗·托索 , 斯凯勒·塞托 , 扎卡里亚·阿尔德涅 , Shadi Pirhosseinloo公司 , 卢卡·扎佩拉 , 巴里·约翰·西奥博尔德 , 尼古拉斯·阿波斯托洛夫 , 乔纳森·谢弗 :
Spatial LibriSpeech:用于空间音频学习的增强数据集。 CoRR公司 abs/2308.09514 ( 2023 ) [i17] 斯凯勒·塞托 , 巴里·约翰·西奥博尔德 , 费德里科·达涅利 , 纳维德普·贾特利 , 丹·布斯布里奇 :
REALM:用于改进单样本测试时间自适应的鲁棒熵自适应损失最小化。 CoRR公司 abs/2309.03964 ( 2023 ) 2022 [i16] 安德鲁·席尔瓦 , 凯瑟琳·梅特卡夫 , 尼古拉斯·阿波斯托洛夫 , 巴里·约翰·西奥博尔德 :
FedEmbed:个性化私人联合学习。 CoRR公司 abs/2202.09472 ( 2022 ) 【i15】 扎卡里亚·阿尔德涅 , 马萨·费德切基纳 , 斯凯勒·塞托 , 凯瑟琳·梅特卡夫 , 米盖尔·萨拉比亚 , 尼古拉斯·阿波斯托洛夫 , 巴里·约翰·西奥博尔德 :
视觉语音质量评估的感知模型。 CoRR公司 abs/2203.10117 ( 2022 ) [第14条] 特里沙·米塔尔 , 扎卡里亚·阿尔德涅 , 马萨·费德切基纳 , 阿努拉·兰扬 , 巴里·约翰·西奥博尔德 :
从语音生成自然的头部运动。 CoRR公司 abs/2210.14800 ( 2022 ) [i13] 尼科·林格 , 米盖尔·萨拉比亚 , 卢卡·扎佩拉 , 巴里·约翰·西奥博尔德 :
骨架表征的对比自我监督学习。 CoRR公司 abs/2211.05304 ( 2022 ) [i12] 凯瑟琳·梅特卡夫 , 米盖尔·萨拉比亚 , 巴里·约翰·西奥博尔德 :
奖励编码环境动力学改进了基于偏好的强化学习。 CoRR公司 abs/2211.06527 ( 2022 ) [i11] 阿克谢·梅赫拉(Akshay Mehra) , 斯凯勒·塞托 , 纳维德普·贾特利 , 巴里·约翰·西奥博尔德 :
了解常见腐败下多重退出模型的稳健性。 CoRR公司 abs/2212.01562 ( 2022 ) 2021 [公元42年] 纳塔尼尔·鲁伊斯 , 巴里·约翰·西奥博尔德 , 阿努拉·兰扬 , 艾哈迈德·胡森·阿卜杜拉齐兹 , 尼古拉斯·阿波斯托洛夫 :
MorphGAN:一步法人脸合成GAN,用于检测识别偏差。 BMVC公司 2021 : 348 [公元41年] 安德鲁·席尔瓦 , 巴里·约翰·西奥博尔德 , 尼古拉斯·阿波斯托洛夫 :
带上下文删除的多模式标点预测。 ICASSP公司 2021 : 3980-3984 [公元40年] 扎卡里亚·阿尔德涅 , 阿努什里·普拉桑纳·库马尔 , 巴里·约翰·西奥博尔德 , 埃里克·马奇 , 萨钦·卡哈雷卡尔 , 德旺·奈克 , 艾哈迈德·侯赛因·阿卜杜拉齐兹 :
视觉线索在视听语音增强中的作用。 ICASSP公司 2021 : 8423-8427 [i10] 安德鲁·席尔瓦 , 巴里·约翰·西奥博尔德 , 尼古拉斯·阿波斯托洛夫 :
带上下文删除的多模式标点预测。 CoRR公司 abs/2102.11012 ( 2021 ) 2020 [公元39年] 艾哈迈德·胡森·阿卜杜拉齐兹 , 巴里·约翰·西奥博尔德 , 保罗·迪克逊 , 莱因哈德·诺特 , 尼古拉斯·阿波斯托洛夫 , 萨钦·卡哈雷克 :
改善表现驱动的谈话面孔的形式退出。 国际资本市场协会 2020 : 378-386 [第九章] 扎卡里亚·阿尔德涅 , 阿努什里·普拉桑纳·库马尔 , 巴里·约翰·西奥博尔德 , 埃里克·马奇 , Sachin Kajarekar公司 , 德旺·奈克 , 艾哈迈德·胡森·阿卜杜拉齐兹 :
视听语音增强视觉语音特征的自我监督学习。 CoRR公司 abs/2004.12031 ( 2020 ) [i8] 艾哈迈德·胡森·阿卜杜拉齐兹 , 巴里·约翰·西奥博尔德 , 保罗·迪克逊 , 莱因哈德·诺特 , 尼古拉斯·阿波斯托洛夫 , 萨钦·卡哈雷克 :
改善表现驱动的谈话面孔的形式退出。 CoRR公司 abs/2005.13616 ( 2020 ) [i7] 纳塔尼尔·鲁伊斯 , 巴里·约翰·西奥博尔德 , 阿努拉·兰扬 , 艾哈迈德·胡森·阿卜杜拉齐兹 , 尼古拉斯·阿波斯托洛夫 :
MorphGAN:一步法人脸合成GAN,用于检测识别偏差。 CoRR公司 腹肌/2012.05225 ( 2020 )
2010 – 2019
2019 [公元38年] 艾哈迈德·胡森·阿卜杜拉齐兹 , 巴里·约翰·西奥博尔德 , 贾斯汀·宾德 , 加布里埃尔·法内利 , 保罗·迪克逊 , 尼古拉斯·阿波斯托洛夫 , 蒂鲍特·韦斯 , 萨钦·卡哈雷克 :
使用域自适应声学模型的独立于扬声器的语音驱动视觉语音合成。 国际资本市场协会 2019 : 220-225 [公元37年] 凯瑟琳·梅特卡夫 , 巴里·约翰·西奥博尔德 , 加勒特·温伯格 , 罗伯特·李 , 英格·马里·琼森 , 拉斯·韦伯 , 尼古拉斯·阿波斯托洛夫 :
镜像以建立数字助理的信任。 INTERSPEECH公司 2019 : 4000-4004 [i6] 凯瑟琳·梅特卡夫 , 巴里·约翰·西奥博尔德 , 加勒特·温伯格 , 罗伯特·李 , 英格·马里·琼森 , 拉斯·韦伯 , 尼古拉斯·阿波斯托洛夫 :
镜像以建立数字助理的信任。 CoRR公司 abs/1904.01664 ( 2019 ) [i5] 艾哈迈德·胡森·阿卜杜拉齐兹 , 巴里·约翰·西奥博尔德 , 贾斯汀·宾德 , 加布里埃尔·法内利 , 保罗·迪克逊 , 尼古拉斯·阿波斯托洛夫 , 蒂鲍特·韦斯 , 萨钦·卡哈雷克 :
使用域自适应声学模型的独立于扬声器的语音驱动视觉语音合成。 CoRR公司 abs/1905.06860 ( 2019 ) 2018 [公元36年] 凯瑟琳·梅特卡夫 , 巴里·约翰·西奥博尔德 , 尼古拉斯·阿波斯托洛夫 :
使用任意数量的代理学习共享行为。 美国原子能机构 2018 : 1232-1240 [i4] 凯瑟琳·梅特卡夫 , 巴里·约翰·西奥博尔德 , 尼古拉斯·阿波斯托洛夫 :
使用任意数量的代理学习共享行为。 CoRR公司 abs/1812.04145 ( 2018 ) 2017 [i3] 海伦·L·熊 , 理查德·哈维 , 巴里·约翰·西奥博尔德 , 萱萱兰 :
视觉语音识别的分辨率限制。 CoRR公司 abs/1710.01073 ( 2017 ) [i2] 海伦·L·熊 , 加里·欧文 , 理查德·W·哈维 , 巴里·约翰·西奥博尔德 :
关于电脑唇读的一些观察:从梦想走向现实。 CoRR公司 abs/1710.01084 ( 2017 ) [i1] 海伦·L·熊 , 理查德·哈维 , 巴里·约翰·西奥博尔德 , 萱萱兰 :
哪种电话到视频地图最能改善电脑的视觉唇读? CoRR公司 abs/1710.01093 ( 2017 ) 2016 [j7] 费利克斯·肖 , 巴里·约翰·西奥博尔德 :
中性视觉语言的表达调制。 IEEE多媒体。 23 ( 4 ) : 68-78 ( 2016 ) [j6] 多米尼克·豪厄尔 , 斯蒂芬·考克斯 , 巴里·约翰·西奥博尔德 :
自动唇读的视觉单元和混淆建模。 图像视觉。 计算。 51 : 1-12 ( 2016 ) 2015 [公元35年] Ausdang Thangthai村 , 巴里·约翰·西奥博尔德 :
基于HMM的动态视觉语音合成。 AVSP公司 2015 : 88-92 [公元34年] 关西瓦唐寨 , 理查德·哈维 , 斯蒂芬·考克斯 , 巴里·约翰·西奥博尔德 :
使用DNN改进唇读性能以实现稳健的视听语音识别。 AVSP公司 2015 : 127-131 [公元33年] 莎拉·泰勒 , 巴里·约翰·西奥博尔德 , 伊恩·马修斯 :
一张满是文字的嘴:视觉一致的声学衰减。 ICASSP公司 2015 : 4904-4908 2014 [公元32年] 莎拉·L·泰勒 , 巴里·约翰·西奥博尔德 , 伊恩·马修斯 :
语速对音频和视觉语音的影响。 ICASSP公司 2014 : 3037-3041 [公元31年] 海伦·L·熊 , 理查德·哈维 , 巴里·约翰·西奥博尔德 , 萱萱兰 :
视觉语音识别的分辨率限制。 ICIP公司 2014 : 1371-1375 [c30] 海伦·L·熊 , 理查德·哈维 , 巴里·约翰·西奥博尔德 , 萱萱兰 :
哪种音素-视觉映射最能改善视觉型电脑唇读? ISVC(2) 2014 : 230-239 2013 [公元29年] 多米尼克·豪厄尔 , 巴里·约翰·西奥博尔德 , 斯蒂芬·考克斯 :
使用加权有限状态传感器进行自动唇读的混淆建模。 AVSP公司 2013 : 197-202 [公元28年] 费利克斯·肖 , 巴里·约翰·西奥博尔德 :
将中性视觉语言转化为富有表现力的视觉语言。 AVSP公司 2013 : 203-208 2012 [j5] 卢克·戴维斯 , 巴里·约翰·西奥博尔德 , 杰森·莱恩斯 , 安多尼·托姆斯 , 安东尼·巴格纳尔 :
关于手部射线照片的分割和分类。 国际神经系统杂志。 22 ( 5 ) ( 2012 ) 【j4】 巴里·约翰·西奥博尔德 , 伊恩·马修斯 :
基于AAM的视觉语音合成的相关客观和主观性能度量。 IEEE传输。 语音音频处理。 20 ( 8 ) : 2378-2387 ( 2012 ) [公元27年] 萱萱兰 , 理查德·哈维 , 巴里·约翰·西奥博尔德 :
深入了解机器唇读。 ICASSP公司 2012 : 4825-4828 [公元26年] 萱萱兰 , 巴里·约翰·西奥博尔德 , 理查德·哈维 :
查看独立电脑唇读。 国际货币兑换协会 2012 : 432-437 [公元25年] 卢克·戴维斯 , 巴里·约翰·西奥博尔德 , 安东尼·巴格纳尔 :
使用特征提取的自动骨龄评估。 理想 2012 : 43-51 [c24] 莎拉·泰勒 , 莫西·马勒 , 巴里·约翰·西奥博尔德 , 伊恩·马修斯 :
视觉语言的动态单位。 计算机动画研讨会 2012 : 275-284 2011 【c23】 卢克·戴维斯 , 巴里·约翰·西奥博尔德 , 安多尼·托姆斯 , 安东尼·巴格纳尔 :
关于手部轮廓的提取和分类。 理想 2011 : 92-99 2010 [公元22年] 雅各布·L·纽曼 , 巴里·约翰·西奥博尔德 , 斯蒂芬·考克斯 :
视觉语音识别的局限性。 AVSP公司 2010 : 1 【c21】 萱萱兰 , 巴里·约翰·西奥博尔德 , 理查德·哈维 , Eng-Jon Ong(工程师) , 理查德·鲍登 :
改善唇读的视觉特征。 AVSP公司 2010 : 7-3 [c20] 莎拉·希尔德 , 巴里·约翰·西奥博尔德 , 理查德·哈维 :
追求虚荣。 AVSP公司 2010 : 8-2
2000 – 2009
2009 [j3] 萨沙·法格尔 , 杰拉德·贝利 , 巴里·约翰·西奥博尔德 :
从音频动画虚拟扬声器或歌手:嘴唇同步面部动画。 EURASIP J.语音音乐。 过程。 2009 ( 2009 ) [第19条] 莎拉·希尔德 , 理查德·哈维 , 巴里·约翰·西奥博尔德 :
基于人和机器的唇读比较。 AVSP公司 2009 : 86-89 [第18条] 萱萱兰 , 理查德·哈维 , 巴里·约翰·西奥博尔德 , Eng-Jon Ong(工程师) , 理查德·鲍登 :
比较唇读的视觉特征。 AVSP公司 2009 : 102-106 [第17条] Eng-Jon Ong(工程师) , 蓝宇轩 , 巴里·约翰·西奥博尔德 , 理查德·哈维 , 理查德·鲍登 :
使用选定的多分辨率线性预测器进行鲁棒面部特征跟踪。 ICCV公司 2009 : 1483-1490 [第16条] 蒂莫西·R·布里克 , 杰弗里·斯皮斯 , 巴里·约翰·西奥博尔德 , 伊恩·马修斯 , 史蒂文·博克 :
高清晰、低带宽、清晰的3D视频会议,只需一个摄像头。 WIAMIS公司 2009 : 308-311 [电子1] 巴里·约翰·西奥博尔德 , 理查德·哈维 :
视听语音处理,AVSP 2009,英国诺维奇,2009年9月10日至13日。 ISCA公司 2009 [目录] 2008 [第15条] 巴里·约翰·西奥博尔德 , 尼古拉斯·威尔金森 , 伊恩·马修斯 :
关于评估合成视觉语音。 AVSP公司 2008 : 7-12 [第14条] 斯蒂芬·考克斯 , 理查德·哈维 , 萱萱兰 , 雅各布·L·纽曼 , 巴里·约翰·西奥博尔德 :
多扬声器唇读的挑战。 AVSP公司 2008 : 179-184 [第13条] 巴里·约翰·西奥博尔德 , 尼古拉斯·威尔金森 :
用于合成视觉语音的概率轨迹合成系统。 INTERSPEECH公司 2008 : 1857-1860 [第12条] 巴里·约翰·西奥博尔德 , 沙沙法格尔 , 杰拉德·贝利 , 弗雷德里克·伊莱西(Frédéric Elisei) :
LIPS2008:视觉语音合成挑战。 INTERSPEECH公司 2008 : 2310-2313 [第11条] 巴里·约翰·西奥博尔德 , 加文·C·考利 , J.安德鲁·班厄姆 , 伊恩·马修斯 , 尼古拉斯·威尔金森 :
比较文本驱动和演讲驱动的视觉语音合成器。 INTERSPEECH公司 2008 : 2322 2007 [第10条] 巴里·约翰·西奥博尔德 , 尼古拉斯·威尔金森 :
使用主动外观模型的实时演讲驱动的说话头。 AVSP公司 2007 : 22 【c9】 艾哈迈德·比拉尔·阿什拉夫 , 西蒙·卢西 , 杰弗里·科恩 , 陈祖汉 , 扎拉·安巴达尔 , 肯尼思·普克钦(Kenneth M.Prkachin) , 帕蒂·所罗门 , 巴里·约翰·西奥博尔德 :
痛苦的脸:使用主动外观模型进行痛苦表情识别。 国际资本市场协会 2007 : 9-14 【c8】 巴里·约翰·西奥博尔德 , 伊恩·A·马修斯 , 杰弗里·科恩 , 史蒂文·博克 :
使用外观模型进行实时表达克隆。 国际资本市场协会 2007 : 134-139 2006 【c7】 巴里·约翰·西奥博尔德 , 伊恩·马修斯 , 西蒙·贝克 :
评估稳健主动外观模型的误差函数。 FGR公司 2006 : 149-154 2004 [注2] 巴里·约翰·西奥博尔德 , J.安德鲁·班厄姆 , 伊恩·马修斯 , 加文·C·考利 :
近视频真实感合成人脸:实施和评估。 语音通信。 44 ( 1-4 ) : 127-140 ( 2004 ) 2003 【b1】 巴里·约翰·西奥博尔德 :
使用形状和外观模型的视觉语音合成。 英国诺维奇东安格利亚大学, 2003 [j1] 巴里·约翰·西奥博尔德 , 西尔科·克鲁斯 , J.安德鲁·班厄姆 , 加文·C·考利 :
使用外观模型实现低带宽的面部对话。 图像可视性。 计算。 21 ( 13-14 ) : 1117-1124 ( 2003 ) 【c6】 巴里·约翰·西奥博尔德 , J.安德鲁·班厄姆 , 伊恩·马修斯 , 加文·C·考利 :
基于外观模型对会说话的头部进行评估。 AVSP公司 2003 : 187-192 【c5】 巴里·约翰·西奥博尔德 , J.安德鲁·班汉姆 , 伊恩·马修斯 , 约翰·R·W·格劳特 , 加文·C·考利 :
使用外观模型的2.5D视觉语音合成。 BMVC公司 2003 : 1-10 【c4】 巴里·约翰·西奥博尔德 , 加文·C·考利 , 伊恩·马修斯 , J.安德鲁·班厄姆 :
使用非刚性外观模型的近视频真实感合成视觉语音。 ICASSP(5) 2003 : 800-803 2002 [c3] 巴里·约翰·西奥博尔德 , J.安德鲁·班厄姆 , 伊恩·马修斯 , 加文·C·考利 :
面向视频真实感合成视觉演讲。 ICASSP公司 2002 : 3892-3895 2001 【c2】 巴里·约翰·西奥博尔德 , J.安德鲁·班厄姆 , 伊恩·马修斯 , 加文·C·考利 :
使用形状和外观统计模型的视觉语音合成。 AVSP公司 2001 : 78-83 【c1】 巴里·约翰·西奥博尔德 , 加文·C·考利 , 西尔科·克鲁斯 , J.安德鲁·班厄姆 :
使用外观模型实现低带宽的面部对话。 BMVC公司 2001 : 1-10