摘要
Arons,B.SpeechSkimmer:一个交互式浏览录制语音的系统。 美国计算机学会人机交互学报,4(1),38,1997。 谷歌学者 数字图书馆 Bacchiani,M.、Hirschberg,J.、Rosenberg,A.、Whittaker,S.、Hindle,D.、Isenhour,P.、Jones,M.,Stark,L.和Zamchick,G.SCANMail:语音邮件域中的音频导航。 程序中。 2001年人类语言技术讲习班。 谷歌学者 数字图书馆 Chalfonte,B.、Fish,R.和Kraut,R.表达丰富性。 程序中。 CHI91,21-261991年。 谷歌学者 数字图书馆 Degen,L.、Mander,R.和Salomon,G.使用音频。 程序中。 CHI92,413-418,1992年。 谷歌学者 数字图书馆 Goldwave数字音频编辑器。 网址:http://www.goldwave.com/ 谷歌学者 Hauptmann,A.和Witbrock,M.Informedia:News-on-Demand Multimedia Information Acquisition and Retrieval,In M.Maybury(Ed.),智能多媒体信息检索,AAAI出版社,213--2391997。 谷歌学者 数字图书馆 Hindus,D.、Schmandt,C.和Horner,C.捕获、构建和表示无处不在的音频。 ACM信息系统交易,1993年11月。 谷歌学者 数字图书馆 Jones,G.、Foote,J.、Spärck Jones,K.和Young,S.《通过组合多个索引源检索口语文档》,In Proc。 SIGIR,30-381996年。 谷歌学者 数字图书馆 Kazman,R.、Al-Halimi,R.,Hunt,W.和Mantei,M.视频会议索引的四种范式。 IEEE多媒体,3(1),63--731996。 谷歌学者 数字图书馆 Schmandt,C.《智能耳朵:数字音频的图形界面》,《IEEE国际控制论与社会会议论文集》,IEEE,佐治亚州亚特兰大,1981年。 谷歌学者 Stifelman,L.、Arons,B.和Schmandt,C.有声笔记本:纸和笔与结构化语音的交互。 程序中。 CHI2001182--1892001。 谷歌学者 数字图书馆 Whittaker,S.、Davies,R.、Hirschberg,J.和Muller,U.Jotmail:一个语音邮件界面,可以让你看到所说的内容。 在CHI2000人机交互会议论文集,89-96。 纽约:ACM出版社,2000年。 谷歌学者 数字图书馆 Whittaker,S.、Hirschberg,J.、Amento,B.、Stark,L.、Bacchiani,M.、Isenhour,P.、Stead,L.,Zamchick G.和Rosenberg,A.SCANMail:语音邮件界面,使语音可浏览、可读和搜索。 《CHI2002年会议记录》,纽约:ACM出版社,275-2822002年。 谷歌学者 数字图书馆 Whittaker,S.、Hirschberg,J.和Nakatani,C.H.所有谈话和所有行动:管理语音邮件信息的策略。 《CHI98人机交互会议论文集》,纽约:ACM出版社,1998年。 谷歌学者 数字图书馆 Whittaker,S.、Hirschberg,J.、Choi,J.,Hindle,D.、Pereira,F.和Singhal,A.SCAN:设计和评估用户界面以支持从语音档案检索。 程序中。 SIGIR99,26-33,纽约:ACM出版社,1998年。 谷歌学者 数字图书馆 Whittaker,S.、Hyland,P.和Wiley。 M.Filochat:手写便笺可以访问录制的对话。 程序中。 CHI94人机交互会议,271--277。 纽约:ACM出版社,1994年。 谷歌学者 数字图书馆 Wilcox,L.Chen,F.,Kimber D.和Balasubramanian,V.使用说话人识别进行语音分割。 程序。 1994年国际声学语音和信号处理会议。 谷歌学者 交叉引用
语义语音编辑
建议
基于HMM的语音识别和自适应合成系统用于发音困难者的语音输入输出通信 构音障碍是一种运动性言语障碍,导致无法控制和协调一个或多个发音器。 这使得构音障碍的说话者很难说出特定的语音单元,从而产生发音不清晰、含糊不清和。。。 基于正则最小方差无失真响应倒谱特征的鲁棒连续语音识别 我们研究了AURORA-4语料库中语音识别系统的低方差和鲁棒性特征。 我们建议从正则化MVDR(RMVDR)谱估计中计算倒谱特征,表示为基于RMVDR的倒谱系数(RMCC)特征。 A。。。