×

细胞波计算框架中的计算听觉场景分析。 (英语) Zbl 1107.68500号

摘要:从听觉混合物中提取实质性听觉对象是听觉研究中一个广泛研究的难题。计算听觉场景分析的目的是基于一组心理声学分组过程在频域中提取物体。为了模拟人类听觉系统的某些方面,本文提出了一种新的基于细胞神经/非线性网络的程序库,形成了一个听觉波计算工具包。

MSC公司:

68T45型 机器视觉和场景理解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 评估自发语音的自动识别技术,并与人类表现进行比较。自发语音处理和识别研讨会,东京,2003年。
[2] Deshmukh,《口语处理国际会议论文集》,第4页,2486–(1996)
[3] Leeuwen,《欧洲演讲会议录2》第1461页–(1995)
[4] , . 机器和人类的大范围视听语音识别。《欧洲演讲会议录》,丹麦,2001年。
[5] Knudsen,《科学美国人》245,第83页–(1981)
[6] 科尼西,《科学美国人》268,第34页–(1993)
[7] 听觉场景分析。麻省理工学院出版社:剑桥,1990年。
[8] 布朗,《计算机语音和语言》,第8页,297页–(1994年)
[9] 计算听觉场景分析。埃尔鲍姆:伦敦,1997年。
[10] 心理声学分组规则的计算机实现。《第十二届模式识别国际会议论文集》,耶路撒冷,1994年。
[11] , . 多智能体系统听觉场景分析中的听觉流分离。《美国人工智能协会会刊》,1994年。
[12] Nakatani,《言语交际》27,第209页–(1999)
[13] 预测驱动的计算听觉场景分析。麻省理工学院电气工程与计算机科学系博士论文,1997年。
[14] Roska,IEEE电路与系统学报II:模拟和数字信号处理40 pp 163–(1993)
[15] Bi-i:独立细胞视觉系统,第一部分。架构和超高帧速率处理示例。《细胞神经网络及其应用八届国际研讨会论文集》,CNNA04,布达佩斯,2004年;4–9.
[16] , . 带有模拟和数字I/O的64位CNN通用芯片,第五届IEEE国际电子、电路和系统会议论文集(ICECS'98),1998;203–206.
[17] , . ACE16K:128{(\ times\)}128焦平面模拟处理器,带数字I/O。第七届IEEE细胞神经网络国际研讨会论文集(CNNA2002),2002;132–139.
[18] , . 笔记本电脑POAC:CNN-UM的紧凑光学实现。细胞神经网络及其应用第八届国际研讨会论文集,CNNA04,布达佩斯,2004;70–75.
[19] 罗斯卡,《电路、系统和计算机杂志》,12页,539–(2003)
[20] 摩尔,《英国医学通报》第43页,第856页–(1987年)
[21] Patterson-Holdsworth听觉滤波器组的高效实现。1993年苹果电脑技术报告#35
[22] 里昂的耳蜗模型。1988年苹果电脑技术报告#13
[23] 耳蜗中滤波、检测和压缩的计算模型。《国际声学、语音和信号处理学报》(IASSP'82),1982年。
[24] 休伊特(Hewitt),《美国声学学会杂志》(Journal of the Acoustical Society of America)87 pp 1813–(1990)
[25] 纬线:周期性声音的代表。1997年慕尼黑国际声学语音和信号处理会议记录;1307–1310.
[26] Meddis,《美国声学学会杂志》,第102页,第1811页–(1997)
[27] 听力基础:导论。学术出版社;纽约,2000年。
[28] Martin,《言语交际》35,第41页–(2001)
[29] , . CNN软件库(模板和算法),7.0版。匈牙利科学院计算机与自动化研究所类比与神经计算实验室(MTASZTAKI)研究报告,DNS-1-1997,布达佩斯,1997年。
[30] Analogic Computers Ltd.美国有线电视新闻网Ace4k芯片软件库,1.0版。研究报告,布达佩斯,2000年。
[31] 通过CNN通用机器使用3{\(\次\)}3个模板进行任意空间卷积:方法和问题。1996年第UCB/ERL M96/5号备忘录。
[32] CNN模板dekompozíció–类似算法CNNUM芯片实现了aciójának egy lehetséges eszköze。博士论文,布达佩斯,1998年(匈牙利)。
[33] .基于起始和偏移分析的听觉分割。俄亥俄州立大学;2005年技术报告:OSU-GSRC-1/05-TR04。
[34] .停止辅音的分离。2003年IEEE声学、语音和信号处理国际会议论文集(ICASSP’03)。
[35] .快速贝叶斯声学定位。2002年IEEE声学、语音和信号处理国际会议论文集(ICASSP02)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。