SLT 2010:美国加利福尼亚州伯克利
Dilek Hakkani-Tür , 玛丽·奥斯滕多夫 :
2010年IEEE口语技术研讨会,SLT 2010,伯克利,加利福尼亚州,美国,2010年12月12-15日。 电气与电子工程师协会 2010 ,国际标准图书编号 978-1-4244-7903-0
语言处理、理解和挖掘
乔里斯·德里森 , 雨果·范·哈姆 , W.巴斯蒂安·克莱因 :
通过输入空间缩放增强的非负矩阵因子分解从图像和语音中学习。 1-6 蒂姆·波尔泽尔 , 塞巴斯蒂安·莫勒 , 弗洛里安·梅茨 :
自动评估语音中个性的声学表现。 7-12 Sree Harsha Yella公司 , 瓦苏提娃·瓦尔马 , 基肖尔·普拉哈拉德 :
主播演讲者片段对构建广播新闻摘要的重要性。 13-18 哥坎·蒂尔 , Dilek Hakkani-Tür , 拉里·P·赫克 :
ATIS中还有什么需要理解? 19-24 艾米丽·莫尔 , 马贾·马塔里奇 , Shrikanth S.Narayanan先生 :
使用情绪轮廓对域外情绪进行稳健表示。 25-30 伊娜·韦克松(Ina Wechsung) , 克劳斯·彼得·恩格尔布雷希特 , 安贾·诺曼 , 塞巴斯蒂安·莫勒 , 斯特凡·谢弗 , 罗伯特·施莱彻 :
调查情态选择策略。 31-36 刘飞 , 杨柳 :
使用口语压缩进行会议总结:一项初步研究。 37-42 约翰·尼克拉斯 , 约翰娜·D·摩尔 :
无偏语篇分割评价。 43-48 亚历克斯·马林 , 玛丽·奥斯滕多夫 , Bin Zhang(张斌) , 乔纳森·摩根 , 梅根-奥克斯利 , 马克·扎克利 , 艾米丽·本德 :
在线讨论中检测权威出价。 49-54 沙吉斯·伊克巴尔 , Om D.Deshmukh先生 , 卡提克·维斯韦斯瓦里亚 , Ashish Verma公司 :
利用命名实体之间的关系改进对话系统中的语音识别。 55-60 东岛龙一郎 , 南美靖弘 , 西川贤治 , Kohji Dohsaka公司 , 东奥米·梅古罗(Toyomi Meguro) , 佐佐希·小桥川(Satoshi Kobashikawa) , Hirokazu Masataki先生 , 吉冈大木 , 佐藤高桥 , 基奎将军 :
改进基于hmm的多域联系中心对话提取摘要。 61-66 徐玉石 , 塞内夫 , 艾丽斯·李 , 乔·波利夫罗尼 :
通过结合扩展CFG解析器和HMM模型进行语义理解。 67-72 Khe Chai Sim村 :
触觉语音识别:通过触摸事件增强语音模态,实现高效的语音识别。 73-78 阿斯利·塞利基尔马兹 , Dilek Hakkani-Tür , 冯俊兰 :
基于概率模型的推特消息情绪分析。 79-84
奖励会议I
Cheongjae Lee(李清杰) , 亚历山大·鲁德尼基 , 加里·金贝·李 :
让我们买书:使用语音搜索查找电子书。 85-90 约瑟夫·波利夫罗尼 , 塞内夫 , S.R.K.布拉纳万 , 王超 , 里贾娜·巴兹雷 :
天哪,我能说! 餐厅评论音频的初步实验。 91-96
海报和演示环节: 语音处理系统
哈根·索尔陶 , 乔治·桑恩 , 布莱恩·金斯伯里 :
IBM Attila语音识别工具包。 97-102 建诚(Jian Cheng) , 沈建强 :
准确识别儿童的口语阅读流利性。 103-108 雷玛·卡希拉 , 米科·库里莫 :
针对重音语音识别的无监督跨语言说话人自适应。 109-114 彼得·卡希尔 , 朱莉·卡森·伯恩德森 :
Muse:一个开源语音技术研究平台。 115-120 何塞·洛佩斯 , 伊莎贝尔·特拉科索 , 科雷亚 , 托马斯·佩莱格里尼 , 雨果·梅内多 , 努诺·J·马梅德 , 马克辛·埃斯克内齐 :
多媒体学习材料。 121-126 西普里安·切尔巴 , 约翰·沙尔克威克 , 托尔斯滕·布兰茨 , 维达哈 , 布洛斯·哈布 , Will Neveit公司 , 卡罗来纳州帕拉达 , 彭旭 :
用于语音搜索的查询语言建模。 127-132 京正 , 阿林达姆·曼达尔 , 辛磊 , 迈克尔·W·弗兰森 , 内奇普·法齐尔·阿扬 , 迪米特拉·维吉里 , 王文(Wen Wang) , 穆拉特·阿巴克 , 克里斯汀·普雷科达 :
在智能手机上实现SRI的普什图语语音转换系统。 133-138 陈雷(Lei Chen) , 基兰·埃文尼 , 谢孙 :
使用元音空间特征评估非母语语音。 139-144 Sungjin Lee(李成金) , 昌谷·金 , Jonghoon Lee公司 , Noh现代 , Kyusong Lee公司 , 加里·金贝·李 :
言语机器人对语言学习的情感影响。 145-150 米奎尔·埃斯皮 , 宫本茂 , 西本拓彦 , 小野信孝 , 佐山茂树 :
用于鲁棒语音活动检测的语音特性分析。 151-156 杰森·威廉姆斯 , 艾克·阿里兹曼迪 , 阿利斯泰尔·康基 :
AT&T“Let’s Go”演示:一个生产级统计口语对话系统。 157-158 迈克尔·约翰斯顿 , 帕特里克·埃伦 :
Speak4IT:野外多模态交互。 159-160 马塞洛·沃斯利 , 迈克尔·约翰斯顿 :
多模式互动空间:MagicTV和magicMAP。 161-162 威廉·斯瓦托 , 大卫·R·特拉姆 , 罗恩·阿尔斯坦 , 丹·诺伦 , 保罗·德贝维奇 , 凯里·布朗尼坎特 , 乔希·威廉姆斯 , 安东·卢斯基 , Shrikanth S.Narayanan先生 , 黛安·皮波尔 , H.查德巷 , 杰基·莫里 , 普里蒂·阿加瓦尔 , 马特·利沃 , 蒋仁元 , 吉利安·格滕 , Selina Chu(朱丽娜) , 凯尔·怀特 :
虚拟博物馆指南演示。 163-164 马提亚斯·埃克 , 伊恩·雷恩 , 张颖(音) , 亚历克斯·魏贝尔 :
Jibbigo:移动设备上的语音到语音翻译。 165-166 湿婆圣达拉姆 , 罗伯特·施莱彻 , 纳塔莉·迪尔 :
演示自动识别“是”或“否”非词汇言语反应以进行基于演讲的交互。 167-168 伊戈尔·斯科 , 扬·塞诺克(Jan Cernock) , 米查尔·法普索 , 约瑟夫·齐兹卡 :
演讲@FIT 讲座浏览器。 169-170
自动语音识别
Amr El-Desoky穆萨 , 阿里·巴沙·沙克 , 拉尔夫·施吕特 , 赫尔曼·奈伊 :
用于德国LVCSR的次现有语言模型。 171-176 Sankaranarayanan Ananthakrishnan公司 , 罗希特·普拉萨德 , 普雷姆·纳塔拉扬 :
一种用于修饰字对齐的无监督增强技术。 177-182 Ngoc Thang Vu村 , 弗兰齐斯卡·克劳斯 , 坦尼娅·舒尔茨 :
多语种a-stabil:一种新的多语种无监督培训置信度评分。 183-188 伊戈尔·斯科 , 弗兰蒂斯克·格里兹尔 , 扬·塞诺克(Jan Cernock) , 米查尔·法普索 , Tomás Cipr公司 :
声学关键词识别器-从最终用户的角度进行优化。 189-193 阿塔·诺鲁齐安 , 理查德·罗斯 :
一种有效的两阶段开放词汇口语词汇检测方法。 194-199 佐佐希·小桥川(Satoshi Kobashikawa) , 太极浅见 , 山口吉川 , 广川正太郎 , 佐藤高桥 :
基于语音和上下文无关模型的先验置信度估计的语音文档检索高效数据选择。 200-205 乔纳斯·洛夫 , 丹尼尔·法拉维尼亚 , 拉尔夫·施吕特 , 迭戈·朱利安尼 , 罗伯托·格雷特 , 赫尔曼·奈伊 :
司法领域自动转录系统的评估。 206-211 岩井惠介(Keisuke Iwami) , 藤井康久 , 山本一弥(Kazumasa Yamamoto) , 中川圣一 :
基于距离连续音节识别结果距离的n-gram数组的球外词检测。 212-217 托比亚斯·赫比格 , 弗兰兹·格尔 , 沃尔夫冈·明克 :
同时语音识别和说话人识别。 218-222 肖恩·刘 , 塞内夫 , 詹姆斯·格拉斯 :
语音语言模型的集合数据生成方法。 223-228 行地址 , 托比约恩·斯文森 :
非母语专有名词发音变异建模中歧视性和非歧视性发音先验词的使用。 229-234 Anoop Deoras公司 , 丹尼斯·菲利莫诺夫 , 玛丽·哈珀 , 弗莱德里克·杰利内克 :
基于经验贝叶斯风险最小化的语音识别模型组合。 235-240 彼得·米洛夫斯基 , 苏米特·乔普拉 , 苏赫里德·巴拉克利什南 , 斯里尼瓦斯·班加罗尔 :
语音识别的功能丰富的连续语言模型。 241-246 辛磊 , 王文(Wen Wang) , 安德烈亚斯·斯托尔克 :
多声学模型的无监督域自适应。 247-252 尤萨夫扎伊(Jibran Yousafzai) , 佐兰·茨维特科维奇 , 彼得·索利希 :
使用支持向量机进行鲁棒语音识别的子带声波波形前端。 253-258 托比亚斯·博克勒 , 安德烈亚斯·迈尔 , 乌尔里希·伊索尔特 , 埃尔马尔·诺思 :
通过整合先验知识改进语音识别器,用于儿童语音的标准化医学评估。 259-264
奖励会议II
陈云农(Yun-Nung Chen) , 于晃(音) , 圣尤孔 , 李林山 :
使用分支熵和韵律/语义特征从口语课程中自动提取关键术语。 265-270 布莱斯·汤姆森 , 菲利普·尤里切克 , 米利卡·加西奇 , 西蒙·凯泽 , 弗朗索瓦·梅莱斯 , Kai Yu公司 , 史蒂夫·杨格(Steve J.Young) :
POMDP口语对话模型的参数学习。 271-276
口语对话系统
杨昭君 , 李百川 , 易珠 , 欧文·金 , 吉娜·安妮·莱沃 , 海伦·M·孟 :
收集用户对使用众包的口语对话系统的判断。 277-282 李百川 , 杨昭君 , 易珠 , 海伦·M·孟 , 吉娜·安妮·莱沃 , 欧文·金 :
使用半监督学习预测用户对口语对话系统的评价。 283-288 基思·维塔宁 , 佩尔·奥拉·克里斯滕森 :
第二次做对:识别口头更正。 289-294 冯琳 , 浮梁翁 :
计算口语对话系统中任何输入短语的置信度。 295-300 希尔克·M·威特 , 沃尔特·罗兰迪 , 伊莱恩·祖伯 , 特德·布鲁克斯 , Araceli大师 , 丽贝卡·罗斯 :
对语音对话系统中呼叫者响应间隔的研究。 301-305 Ekapol Chuangsuwanich公司 , D.斯科特·塞弗斯 , 詹姆斯·格拉斯 , 赛斯·J·泰勒 :
户外环境中大型移动机器人的口语指令。 306-311 加布里埃尔父母 , 马克辛·埃斯克内齐 :
迈向更好的众包转录:Let's Go Bus信息系统一年数据的转录。 312-317 蒂齐亚娜·利戈里奥 , 苏珊·爱泼斯坦 , 丽贝卡·帕索诺 :
巫师的对话策略,用于处理噪音语音识别。 318-323 京杜克·金 , Cheongjae Lee(李清杰) , 李东贤 , Junhwi Choi(蔡俊伟) , 桑肯·荣格(Sangkeun Jung) , 加里·金贝·李 :
为基于示例的对话管理建模确认。 324-329 大卫·苏恩德曼 , 杰克逊·利斯科姆 , 罗伯托·皮耶拉奇尼 :
争论者。 330-335 南美靖弘 , 东岛龙一郎 , Kohji Dohsaka公司 , 东奥米·梅古罗(Toyomi Meguro) , 前田卫作 :
使用POMDP的三角图对话控制。 336-341 阿曼达·J·斯坦特 , 斯里尼瓦斯·班加罗尔 :
对话结构和共指消解之间的相互作用。 342-347 Ea-Ee-Jan公司 , 布莱恩·金斯伯里 :
为自然语言呼叫路由系统快速而廉价地开发语音动作分类器。 348-353 Teruhisa Misu公司 , 杉浦科美 , Kiyonori Ohtake公司 , Chiori Hori公司 , 高冈秀树 , Hisashi Kawai先生 , 中村佐治 :
对话策略优化,帮助用户决定口语咨询对话系统。 354-359 向佐 , Taisuke Sumii公司 , 岩桥直人 , Kotaro Funakoshi公司 , 中野美雄 , Natsuki Oka公司 :
通过语音交互纠正单词学习中的音素识别错误。 360-365
语音信息提取与检索
蒂莫西·哈森 :
用于计算口语文档相似性的直接和潜在建模技术。 366-371 沙吉斯·伊克巴尔 , 卡提克·维斯韦斯瓦里亚 :
使用词共现模型调用转录本分割。 372-377 渡边信治 , 岩田聪 , 高崎县 , 酒藤忠司 , 有木康夫 :
主题跟踪模型在语言模型自适应和会议分析中的应用。 378-383 吴孟松 , 李洪申 , 王信民 :
在主题建模中利用语义关联信息。 384-388 李鸿业(Hung-yi Lee) , 陈家平(Chia-Ping Chen) , 程凤叶 , 李林山 :
一个集成了不同相关性反馈场景和口语术语检测方法的框架。 389-394 Welly Naptali公司 , 筑谷正人(Masatoshi Tsuchiya) , 中川圣一 :
基于主题相关类的自动语音识别语言模型评估。 395-400 弗雷德里克·贝歇(Frédéric Béchet) , 克里斯蒂安·雷蒙德 , 杜威神父 , 雷纳托·德·莫里 :
基于框架的会话言语解释。 401-406 马可·迪纳雷利 , 亚历山德罗·莫希蒂 , 朱塞佩·里卡迪 :
假设重新标记语义注释的选择。 407-411 迈克尔·莱维特 :
利用呼叫上下文信息改进可信度分类。 412-417 Man-Hung Siu公司 , 特德·维森 , 伊凡·布利科 , 欧文·金鲍尔 :
改进了基于语言模型自适应的会话语音命名实体提取。 418-423 高崎县 , 荒木昭子 , Takuya Yoshioka先生 , 藤本正彦 , 渡边信治 , Takanobu Oba公司 , 小川Atsunori , 大冢和弘 , 丹·米卡米 , 木下惠介 , 中谷智宏 , 中村厚司 , 山本俊二 :
使用远程麦克风和全向摄像头进行实时会议识别和理解。 424-429 肯·萨多哈拉 :
非正式多方会议的核心主题分割和词汇不足导致的性能下降。 430-435 史伯乐 :
轻度监督文本规范化学习:俄罗斯数字名称。 436-441 玛丽亚·安东尼亚·鲁斯·迪亚斯 , 路易斯·卡洛斯·阿尔塔米拉诺 , 卡洛斯·雷耶斯·加西亚 , 奥斯卡·埃雷拉·阿尔坎塔拉 :
婴儿哭声中定性特征的自动识别。 442-447
2010年口语对话挑战赛(第一部分)
2010年口语对话挑战赛(第二部分)
贾娜·戈泽 , 塔贾娜·谢夫勒 , 罗兰·罗勒 , 诺伯特·赖辛格 :
公交车信息系统评估的用户模拟。 454-459 布莱斯·汤姆森 , Kai Yu公司 , 西蒙·凯泽 , 米利卡·加西奇 , 菲利普·尤里切克 , 弗朗索瓦·梅莱斯 , 史蒂夫·杨格(Steve J.Young) :
Let’s Go口语对话挑战的贝叶斯对话系统。 460-465 海伦·赖特·哈斯蒂 , 尼古拉斯·梅里高德 , 刘兴坤 , 奥利弗·莱蒙 :
“走吧,DUDE!”利用口语对话挑战来教授口语对话的发展。 466-471 杨昭君 , 李百川 , 易珠 , 欧文·金 , 吉娜·安妮·莱沃 , 海伦·M·孟 :
口语对话系统评价中用户满意度预测的协同过滤模型。 472-477 易珠 , 杨昭君 , 海伦·M·孟 , 李百川 , 吉娜·安妮·莱沃 , 欧文·金 :
使用有限状态机评估口语对话系统。 478-483 玛丽亚姆·哈比比 , Siavash Rahbar N.公司。 , 侯赛因·萨梅蒂 :
口语对话系统中复杂菜单问题的分块POMDP方法。 484-489