塔马斯·格里斯
人员信息
优化列表
2020年–今天
2024 [公元9年] 乔治奥斯·卡拉卡西迪斯 , 米科·库里莫 , 彼得·贝尔 , 塔马斯·格里斯 :
端到端ASR新课程标准的比较与分析。 语音通信。 163 : 103113 ( 2024 ) [j8] 阿库·柔和 , 塔马斯·格里斯 , 米科·库里莫 :
端到端语音识别的原则性比较:1000小时尺度下的注意力与混合。 IEEE ACM传输。 音频语音语言处理。 32 : 623-638 ( 2024 ) [j7] 德扬·波贾佐夫斯基 , 塔马斯·格里斯 , 米科·库里莫 :
从原始语音到固定表示:语音嵌入技术的综合评估。 IEEE ACM传输。 音频语音语言处理。 32 : 3546-3560 ( 2024 ) [公元41年] 安妮·马特·豪格·奥尔斯塔德 , 安娜·斯莫兰德 , 索菲亚·斯特伦贝格森 , 莎丽伊莱恩 , 米娜·莱顿 , 米科·库里莫 , 雅罗斯拉夫·盖特曼 , 塔马斯·格里斯 , 曹新伟(Xinwei Cao) , 托比约恩·斯文森 , Giampiero Salvi公司 :
收集用于评估北欧语言儿童发音的语言资源。 LREC/冷却 2024 : 3529-3537 [公元40年] 安贾·维尔库恩 , 马雷克·萨瓦斯 , 黄光浦 , 塔马斯·格里斯 , 米科·库里莫 :
调查预训练AV-HuBERT发现的簇。 ICASSP公司 2024 : 11196-11200 2023 [j6] 雅罗斯拉夫·盖特曼 , Nhan Phan公司 , Ragheb Al-Ghezi公司 , 叶卡捷琳娜·沃斯科波尼克 , 米图尔·辛格 , 塔马斯·格里斯 , 米科·库里莫 , Giampiero Salvi公司 , 托比约恩·斯文森 , 索菲亚·斯特伦贝格森 , 安娜·瑞卡·斯莫兰德 , 莎丽伊莱恩 :
开发人工智能辅助的儿童低资源口语学习应用程序。 IEEE接入 11 : 86025-86037 ( 2023 ) [j5] 安西·莫西奥 , 德扬·波尔贾佐夫斯基 , 阿库鲁河 , 雅罗斯拉夫·盖特曼 , 安贾·维尔库恩 , Ragheb Al-Ghezi公司 , 米埃塔·莱恩斯 , 塔马斯·格里斯 , 克里斯特·林登 , 米科·库里莫 :
Lahjoita puhetta:一个大型芬兰语口语语料库,带有一些基准。 语言资源。 评价 57 ( 三 ) : 1295-1327 ( 2023 ) [公元39年] 德扬·波贾佐夫斯基 , 塔马斯·格罗斯 , 米科·库里莫 :
自发性演讲的主题识别:用嵌入式语言信息丰富音频特征。 欧盟SIPCO 2023 : 396-400 [公元38年] 塔马斯·格里斯 , 雅罗斯拉夫·盖特曼 , Ragheb Al-Ghezi公司 , 阿库·柔和 , 米科·库里莫 :
研究wav2vec2上下文表示和微调的影响,芬兰模型的案例研究。 INTERSPEECH公司 2023 : 196-200 [公元37年] 德扬·波贾佐夫斯基 , 雅罗斯拉夫·盖特曼 , 塔马斯·格里斯 , 米科·库里莫 :
使用大型预训练模型和贝叶斯推断提高音频情感和意图识别。 ACM多媒体 2023 : 9477-9481 [公元36年] 塔马斯·格里斯 , 安贾·维尔库恩 , 德扬·波贾佐夫斯基 , 米科·库里莫 :
发现BERT、Wav2Vec 2.0、ELECTRA和ViT嵌入的相关子空间,用于集成渐变的幽默和模拟情感识别。 MuSe@ACM 多媒体 2023 : 27-34 [公元35年] Nhan Phan公司 , 塔马斯·格罗斯 , 米科·库里莫 :
CaptainA-一款用于练习芬兰语发音的手机应用程序。 没有DaLiDa 2023 : 265-270 [公元34年] 雷玛·卡希拉 , 莎丽伊莱恩 , 安娜·瑞卡·斯莫兰德 , 阿库·柔和 , Ragheb Al-Ghezi公司 , 雅罗斯拉夫·盖特曼 , 塔马斯·格里斯 , 玛丽亚·乌瑟尔 , 米科·库里莫 :
一个嵌入儿童外语学习游戏的发音评分系统,并对学习益处进行了实验验证。 SLaTE公司 2023 : 21-25 [公元33年] 雅罗斯拉夫·盖特曼 , Ragheb Al-Ghezi公司 , 塔马斯·格里斯 , 米科·库里莫 :
多任务wav2vec2用作儿童发音训练系统。 SLaTE公司 2023 : 36-40 [i10] 德扬·波贾佐夫斯基 , 塔马斯·格里斯 , 米科·库里莫 :
自发性演讲的主题识别:用嵌入式语言信息丰富音频特征。 CoRR公司 abs/2307.11450 ( 2023 ) [第九章] 德扬·波贾佐夫斯基 , 雅罗斯拉夫·盖特曼 , 塔马斯·格里斯 , 米科·库里莫 :
使用大型预训练模型和贝叶斯推断提高音频情感和意图识别。 CoRR公司 abs/2310.10179 ( 2023 ) 2022 [公元32年] 塔马斯·格里斯 , 努拉·卡利奥尼埃米 , 哈里·基斯基宁 , 金莫·莱恩 , 安西·莫西奥 , 托米·伦波蒂 , 安贾·维尔库恩 , 汉努·萨尔米 , 米科·库里莫 , Jorma Laaksonen公司 :
追踪20世纪50年代芬兰小说电影中的城市化迹象:走向视听数据的多模式分析。 DHNB公司 2022 : 63-78 [公元31年] 乔治奥斯·卡拉卡西迪斯 , 塔马斯·格里斯 , 米科·库里莫 :
端到端ASR新课程标准的比较与分析。 INTERSPEECH公司 2022 : 66-70 [c30] 雅罗斯拉夫·盖特曼 , Ragheb Al-Ghezi公司 , 卡贾·沃斯科波尼克 , 塔马斯·格里斯 , 米科·库里莫 , Giampiero Salvi公司 , 托比约恩·斯文森 , 索菲亚·斯特伦贝格森 :
基于wav2vec2的语音障碍儿童语音评分系统。 INTERSPEECH公司 2022 : 3618-3622 [公元29年] 塔马斯·格罗斯 , 德扬·波贾佐夫斯基 , 雅罗斯拉夫·盖特曼 , 苏达萨娜·雷迪·卡迪里 , 米科·库里莫 :
基于Wav2vec2的副语言系统,用于识别发声情绪和口吃。 ACM多媒体 2022 : 7026-7029 [i8] 安西·莫西奥 , 德扬·波贾佐夫斯基 , 阿库·柔和 , 雅罗斯拉夫·格特曼 , 安贾·维尔库恩 , 塔马斯·格里斯 , 克里斯特·林登 , 米科·库里莫 :
Lahjoita puhetta-一个大型芬兰语口语语料库,带有一些基准。 CoRR公司 abs/2203.12906 ( 2022 ) [i7] 乔治奥斯·卡拉卡西迪斯 , 塔马斯·格里斯 , 米科·库里莫 :
端到端ASR新课程标准的比较与分析。 CoRR公司 abs/2208.05782 ( 2022 ) [i6] 塔马斯·格里斯 , 米图尔·辛格 , 苏达萨娜·雷迪·卡迪里 , 赫曼特·库马尔·卡塔尼亚 , 米科·库里莫 :
面向准语言学任务的端到端基于集成的特征选择。 CoRR公司 abs/2210.15978 ( 2022 ) 2021 [公元28年] 塔马斯·格里斯 , 米科·库里莫 :
LSTM-XL:LSTM细胞的注意力增强长期记忆。 TDS公司 2021 : 382-393 2020 【j4】 鲁道夫·费伦茨 , 德内斯·班恩 , 塔马斯·格里斯 , 蒂博·吉莫西 :
深入学习基于度量的静态错误预测。 阵列 6 : 100021 ( 2020 ) [j3] 哥斯托利亚 , 塔马斯·格里斯 , 拉兹洛托斯 :
基于概率抽样DNN训练的社会信号检测。 IEEE传输。 影响。 计算。 11 ( 1 ) : 164-177 ( 2020 ) [公元27年] 赫曼特·库马尔·卡塔尼亚 , 米图尔·辛格 , 塔马斯·格里斯 , 米科·库里莫 :
使用韵律和假开头进行数据增强以识别非母语儿童的言语。 INTERSPEECH公司 2020 : 260-264 [公元26年] 塔马斯·格里斯 , 米科·库里莫 :
使用深度自动编码器对基于DNN的声学模型进行可视化解释。 MLVis@Eurographics /欧洲签证 2020 : 25-29 [i5] 塔马斯·格里斯 , 米图尔·辛格 , 苏达萨娜·雷迪·卡迪里 , 赫曼特·库马尔·卡塔尼亚 , 米科·库里莫 :
阿尔托为INTERSPEECH 2020计算准语言学挑战设计的端到端DNN系统。 CoRR公司 abs/2008.02689 ( 2020 ) [i4] 赫曼特·库马尔·卡塔尼亚 , 米图尔·辛格 , 塔马斯·格里斯 , 米科·库里莫 :
使用韵律和假启动进行数据增强,以识别非母语儿童的语音。 CoRR公司 abs/2008.12914 ( 2020 )
2010 – 2019
2019 [注2] 拉兹洛·瓦尔加 , 阿提拉·科瓦奇 , 塔马斯·格里斯 , 盖萨·图里 , 弗洛拉·哈达利斯 , Rózsa Dégi , 约瑟夫·多比 :
OCT图像中高反射病灶的自动分割。 计算。 方法生物识别程序。 178 : 91-103 ( 2019 ) [公元25年] 盖格利·帕普 , 加博尔·莱科 , 塔马斯·格里斯 :
使用卷积神经网络的二元层析成像无重构投影选择程序。 ICIAR(1) 2019 : 228-236 [公元24年] 哥斯托利亚 , 阿尔达姆·品特 , 拉兹洛托斯 , 塔马斯·格里斯 , 亚历山德拉·马克奥 , 塔马斯·加博尔·萨波 :
基于自动编码器的超声波无声语音接口的关节声映射。 国际JCNN 2019 : 1-8 【c23】 塔马斯·加博尔·萨波 , 穆罕默德·萨拉赫·阿勒迪 , 盖萨·内梅特 , 哥斯托利亚 , 塔马斯·格里斯 , 拉兹洛托斯 , 亚历山德拉·马克奥 :
基于超声波的无声语音接口,构建在连续声码器上。 INTERSPEECH公司 2019 : 894-898 [第1页] 吉尔吉斯·科瓦奇 , 塔马斯·格罗斯 , 塔马斯·瓦拉迪 :
使用深层整流神经网络和概率抽样进行局部单元分类。 认知信息传播、理论与应用 2019 : 1-24 [i3] 哥斯托利亚 , 阿尔达姆·品特 , 拉兹洛托斯 , 塔马斯·格里斯 , 亚历山德拉·马克奥 , 塔马斯·加博尔·萨波 :
基于自动编码器的超声波无声语音接口的关节声映射。 CoRR公司 abs/1904.05259 ( 2019 ) [i2] 塔马斯·加博尔·卡萨波 , 穆罕默德·萨拉赫·阿勒迪 , 盖萨·内梅特 , 哥斯托利亚 , 塔马斯·格里斯 , 拉兹洛托斯 , 亚历山德拉·马克奥 :
基于超声波的无声语音接口,构建在连续声码器上。 CoRR公司 abs/1906.09885 ( 2019 ) 2018 【b1】 塔马斯·格里斯 :
语音识别中基于深度神经网络的声学模型的训练方法。 匈牙利塞格德大学, 2018 [j1] 佩特尔·博德纳 , 塔马斯·格里斯 , 拉兹洛托斯 , 拉什洛·G·纽尔 :
使用神经网络进行有效的可视代码定位。 模式分析。 申请。 21 ( 1 ) : 249-260 ( 2018 ) [公元22年] 塔马斯·格里斯 , 哥斯托利亚 , 拉兹洛托斯 , 塔马斯·加博尔·萨波 , 亚历山德拉·马克奥 :
基于DNN的超声无声语音接口的F0估计。 ICASSP公司 2018 : 291-295 [c21] 梅琳达·卡托纳 , 阿提拉·科瓦奇 , 拉兹洛·瓦尔加 , 塔马斯·格里斯 , 约瑟夫·多比 , 罗萨·代吉 , LászlóG.尼奥尔 :
OCT图像中生物标记物的自动检测和表征。 ICIAR公司 2018 : 706-714 [公元20年] 哥斯托利亚 , 塔马斯·格里斯 , 拉兹洛托斯 :
用于分类哭声、非典型和自我评估情感和心跳的通用语音级特征提取。 INTERSPEECH公司 2018 : 531-535 [第19条] 拉兹洛托斯 , 哥斯托利亚 , 塔马斯·格里斯 , 亚历山德拉·马克奥 , 塔马斯·加博尔·萨波 :
基于超声波的无声语音接口的语音识别和语音合成参数的多任务学习。 INTERSPEECH公司 2018 : 3172-3176 2017 [第18条] 塔马斯·格里斯 , 哥斯托利亚 , 拉兹洛托斯 :
使用概率抽样训练上下文相关的DNN声学模型。 INTERSPEECH公司 2017 : 1621-1625 [第17条] 塔马斯·格里斯 , 哥斯托利亚 , 拉兹洛托斯 :
用于ASR的GMM自由态连接方法的比较评估。 INTERSPEECH公司 2017 : 1626-1630 [第16条] 哥斯托利亚 , 罗伯特·布萨·费科特 , 塔马斯·格里斯 , 拉兹洛托斯 :
基于DNN的特征提取和分类器组合用于儿童定向语音、感冒和打鼾的识别。 INTERSPEECH公司 2017 : 3522-3526 [第15条] 塔马斯·加博尔·萨波 , 塔马斯·格里斯 , 哥斯托利亚 , 拉兹洛托斯 , 亚历山德拉·马克奥 :
基于DNN的无声语音接口的超声波语音转换。 INTERSPEECH公司 2017 : 3672-3676 2016 [第14条] 吉尔吉斯·科瓦奇 , 塔马斯·格里斯 , 塔马斯·瓦拉迪 :
使用深度神经网络和概率抽样进行主题单元分类。 CogInfoCom公司 2016 : 199-204 [第13条] 哥斯托利亚 , 拉兹洛托斯 , 塔马斯·格里斯 , 维罗妮卡·文泽 , 伊尔迪科·霍夫曼 , 格里塔·萨特洛茨基 , 马格多尔纳·帕卡斯基 , János Kálmán :
通过基于相关性的语音特征选择从自发语音中检测轻度认知障碍。 INTERSPEECH公司 2016 : 107-111 [第12条] 哥斯托利亚 , 塔马斯·格里斯 , György Szaszak , 拉兹洛托斯 :
通过DNN等级学习和韵律分析评估言语中道歉的真诚性。 INTERSPEECH公司 2016 : 2026-2030 [第11条] 哥斯托利亚 , 塔马斯·格里斯 , 罗伯特·布萨·费科特 , 拉兹洛托斯 :
使用语音特征和分类器组合确定母语和欺骗。 INTERSPEECH公司 2016 : 2418-2422 [c10] 哥斯托利亚 , 塔马斯·格里斯 , 拉兹洛托斯 :
无GMM-Free平面启动序列鉴别DNN训练。 INTERSPEECH公司 2016 : 3409-3413 [i1] 哥斯托利亚 , 塔马斯·格里斯 , 拉兹洛托斯 :
无GMM-Free平面启动序列鉴别DNN训练。 CoRR公司 abs/1610.03256 ( 2016 ) 2015 【c9】 哥斯托利亚 , 塔马斯·格里斯 , 拉兹洛托斯 , 大卫·伊姆森 :
使用基于Kullback-Leibler发散的状态绑定构建上下文相关的DNN声学模型。 ICASSP公司 2015 : 4570-4574 【c8】 塔马斯·格里斯 , 罗伯特·布萨·费科特 , 哥斯托利亚 , 拉兹洛托斯 :
使用高斯过程和深度整流神经网络评估自然度和帕金森病状态。 INTERSPEECH公司 2015 : 919-923 2014 【c7】 佩特尔·博德纳 , 塔马斯·格里斯 , 拉兹洛托斯 , 拉什洛·G·纽尔 :
使用深度整流神经网络在DCT域中定位视觉代码。 ANNIIP公司 2014 : 37-44 【c6】 哥斯托利亚 , 塔马斯·格里斯 , 罗伯特·布萨·费科特 , 拉兹洛托斯 :
使用AdaBoost和深层整流器神经网络检测认知和物理负荷的强度。 INTERSPEECH公司 2014 : 452-456 【c5】 塔马斯·格里斯 , 佩特尔·博德纳 , 拉兹洛托斯 , 拉什洛·G·纽尔 :
使用深度神经网络的二维码定位。 MLSP公司 2014 : 1-6 【c4】 塔马斯·格里斯 , 哥斯托利亚 , 拉兹洛托斯 :
语音识别中深度校正神经网络的序列训练方法。 SPECOM公司 2014 : 81-88 【c3】 吉尔吉斯·科瓦奇 , 拉兹洛托斯 , 塔马斯·格里斯 :
使用深度神经网络和光谱时间特征的鲁棒多波段ASR。 SPECOM公司 2014 : 386-393 【c2】 塔马斯·格里斯 , István Nagy T。 :
使用深度校正神经网络和概率抽样进行文档分类。 TSD公司 2014 : 108-115 2013 【c1】 拉兹洛托斯 , 塔马斯·格里斯 :
大词汇量语音识别中深度神经网络训练方法的比较。 TSD公司 2013 : 36-43