AVSP 2005:加拿大不列颠哥伦比亚省温哥华岛
埃里克·瓦蒂基奥蒂斯·贝特森 :
2005年视听语音处理,加拿大不列颠哥伦比亚省温哥华岛,2005年7月24-27日。 国际标准协会 2005
特邀报告
珍妮特·比文·巴韦拉斯 :
欣赏面对面的对话。 1
人类对视听语言的感知和处理
汉斯约格·米克斯多夫 , Patavee Charnvivit公司 , 丹尼斯·K·伯纳姆 :
泰语音节声调的视听感知。 3-8 多米尼克·W·马萨罗 , 米格尔·伊达尔戈-伯恩斯 :
读我的嘴唇:动画脸有助于传达音乐歌词。 9至10 阿兹拉·纳希德·阿里 , 阿什拉夫·哈桑·哈吉 , 迈克尔·英格比 , 阿里·伊德里西 :
阿拉伯语单词中的McGurk融合效果。 11-16 Jeesun Kim先生 , 克里斯·戴维斯 , 纪尧姆·维格纳利 , 哈罗德·希尔 :
伦巴第反射的视觉伴随物。 17-22 妮可·李斯 , 丹尼斯·K·伯纳姆 :
促进时尚的语音检测!: 视觉说话风格对噪声中语音检测的影响。 23-28 马克运动衫 , 埃米尔·克莱默 :
视听线索对突显的认知加工。 29-30 谢丽尔·卡佩克 , 露丝·坎贝尔 , 梅雷亚德·麦克斯威尼 , Marc L.印章 , 达菲德水域 , 本西·沃尔 , 托尼·戴维 , 菲利普·麦奎尔 , 米克·布拉默 :
从静止的脸上读出言语和情绪:功能磁共振成像结果。 31-34 亚历山德拉·杰西 , 多米尼克·W·马萨罗 :
朝向感知的词汇模糊逻辑模型:单词识别中视听语音处理的时间过程。 35-36 雅克·科尔曼 , 乔治·梅耶 :
视觉语音中共同发音片段的整合。 37-38 江锦涛 , 林恩·伯恩斯坦 , 小爱德华·T·奥尔。 :
感知一致和不一致的视听言语刺激。 39-44 修身Ouni , 迈克尔·科恩 , 霍普·伊沙克 , 多米尼克·W·马萨罗 :
视觉对言语感知的贡献:测量说话头部的可懂度。 45-46 米切尔·沃什 , 史蒂芬·威尔逊 :
基于agent的视听语言调查框架。 47-52 丹尼尔·卡伦 :
内部模型在非母语元音对比的视听感知中存在差异。 53-54 维克托·钟 , 妮可·米兰特 , 朱利安·奥顿 , 埃里克·瓦蒂基奥蒂斯·贝特森 :
伦巴第语的视听处理。 55-56 V.多古·埃尔德纳 , 丹尼斯·K·伯纳姆 :
英语儿童视听言语知觉的发展:语言特定因素的作用。 57-62 哈罗德·希尔 , 埃里克·瓦蒂基奥蒂斯·贝特森 :
使用图形来研究语音噪音的感知,反之亦然。 63-64 文森特·罗伯特 , Brigitte Wrobel-Dautcourt女士 , 伊夫·拉普利 , 安妮·邦诺 :
为了建立一个正式的法语协同发音模型,对唇音协同发音的说话人间变异性进行了研究。 65-70
特邀报告
尤汉·帕扬 :
如何为语音生成的研究建立面部和舌头生物力学模型? 71-72
基于机器的视听语音识别与处理
帕特里克·鲁西 , 大卫·迪恩 , Sridha Sridharan公司 :
与当前基于区域的可视语音特征提取技术相关的问题。 73-78 Gerasimos Potamianos公司 , 帕特里夏·斯坎伦 :
在基于外观的自动语音朗读中利用下脸对称性。 79-84 西蒙·卢西 , 帕特里克·鲁西 :
通过自由部分表示改进语音阅读。 85至86 埃德森·伯塞纳斯 , 毛里西奥·迪亚斯 , 拉斐尔·卡里略 , 里卡多·索拉诺 , 卡罗琳娜·索托 , 路易斯·瓦尔德拉马 , 哈维尔·维莱加斯 , 佩德罗·维兹卡亚 :
一种用于可视电话序列的编码方法。 87-92 彼得·西萨尔 , 米洛斯·泽勒锌 , 兹德内克·克努尔 , 雅库布·卡尼斯 , 简·泽林卡 , 卢德克·米勒 :
设计和录制用于视听连续语音识别的捷克语语料库。 93-96 大卫·迪恩 , 帕特里克·鲁西 , Sridha Sridharan公司 :
使用CUAVE数据库进行视听扬声器识别。 97-102 薛剑霞 , 江锦涛 , 阿贝尔·阿尔万 , 林恩·伯恩斯坦 :
基于连续语音视觉特征机器分类的辅音混淆结构。 103-108
视听语言的产生
罗兰·戈克 :
三维唇部跟踪和协同惯性分析用于提高音视频自动语音识别的鲁棒性。 109-114 玛丽恩·多恩 , 赫莱恩·洛文布鲁克 , 哈罗德·希尔 :
一种识别法语对比焦点视听面部相关性的多测量方法。 115年至116年 菲利普·鲁宾 , 戈登·拉姆齐 , 马克·铁德 :
哈斯金斯实验室发音合成的历史。 第117页至第118页 西德尼·S·费尔斯 , 弗洛里安·沃格特 , Kees van den Doel公司 , 约翰·劳埃德 , 奥利弗·冈瑟 :
Artisynth:一种可扩展的跨平台三维发音语音合成器。 119-124 弗雷德里克·伊莱西(Frédéric Elisei) , 杰拉德·贝利 , 纪尧姆·吉伯特 , 雷米·布伦 :
捕获数据和逼真的三维模型,用于线索语音分析和视听合成。 125-130 高崎县 :
用于视听语音动画的三维人脸统计分析和合成。 131-136 索尼娅·桑加里 , 穆斯塔法·斯基里 , 贝蒂尔·莱伯格 :
言语行为中某些交流头部运动的计算模型。 137-142 弗洛里安·沃格特 :
舌的有限元建模。 143-144 Brigitte Wrobel-Dautcourt女士 , 玛丽·奥迪尔·伯杰 , 布莱斯·波塔德 , 伊夫·拉普利 , 修身Ouni :
一种低成本的基于立体视觉的系统,用于获取可见的发音数据。 145-150
特邀报告
艾伦·G·汉南 :
人类颌骨的结构和功能。 151