第26 TSD 2023:捷克共和国皮尔森
卡米尔·埃克斯坦 , 弗朗蒂斯克·帕特尔 , 米洛斯拉夫·科诺皮克 :
文本、演讲和对话——第26届国际会议,TSD 2023,捷克共和国皮尔森,2023年9月4日至6日,会议记录。 计算机科学课堂讲稿 14102, 施普林格 2023 ,国际标准图书编号 978-3-031-40497-9
文本
王晓天 , 李廷轩 , 田村拓哉 , 西田顺介 , 朱福珠 , 武彦太郎(Takehito Utsuro) :
基于生成模型的多任务学习的日语机器阅读理解。 3-14 亚历斯·扎加 , 马克·罗布尼克·西科尼亚 :
统治所有人的一种模式:斯洛文尼亚总结排名。 15-24 Frantisek Trebuna公司 , 克里斯蒂娜·萨波娃 , Ondrej Bojar公司 :
寻找变形金刚成功的原因:记忆与概括。 25-32 海内克·基德利切克 , 金德里奇·利波维奇 :
捷克新闻文本分类的数据集和强大基线。 33-44 不,埃米·瓦达什 :
使用ChatGPT解决匈牙利回隐。 45-57 György Orosz公司 , 格戈·萨博 , 佩特·伯克茨 , Zsolt Szántó , 里查德·法卡斯 :
使用HuSpaCy推进匈牙利文本处理:高效准确的NLP管道。 58-69 格雷戈·多纳吉 , 斯佩拉·安特洛加 :
ParaDiom——成语文本的平行语料库。 70-81 凯·哈顿 , Aaricia Herygers公司 , Shubham Vijay Kurlekar公司 , 卡巴布·扎卡里亚 , 泰兰·沃尔坎 , Sören Gröttrup公司 , 穆尼尔·乔治斯 :
机器翻译中情感偏差的测量。 82-93 杨子健 , 拉兹洛·贾诺斯·拉基 , 塔马斯·瓦拉迪 , 加博尔·普洛什基 :
匈牙利语的单语和多语言GPT-3模型。 94-104 Vojtech约翰 , Zdenek Zabokrtsk :
形态分类的难以忍受的轻重。 105-115 丹尼斯·梅梅斯海默 , 卡林·哈布什 :
一个德语平行小句坐标省略语料库,将来自TüBa-D/Z树库的句子与重建的规范形式对齐。 116-128
演讲
何塞·文森特·埃加斯·洛佩斯 , 哥斯托利亚 :
通过编码语音表征识别戴口罩的人。 131-140 托比亚斯·韦斯 , 安德烈亚斯·迈尔 , Kubilay Can Demir公司 , 保拉·安德烈亚·佩雷斯-托罗 , 托马斯·阿里亚斯·维尔加拉 , 比约恩·海斯曼 , 埃尔马尔·诺思 , 玛丽亚·舒斯特 , Seung Hee Yang(承熙阳) :
将病理言语纳入训练前对病理检测的影响。 141-153 托马斯·杰利内克 :
捷克语口语语料库的形态标记和柠檬化。 154-163 蒂鲍尔特·巴涅拉斯·鲁克斯 , 简·沃塔瓦 , 米凯尔·罗维尔 , 特瓦·梅林 , 理查德·杜福尔 :
HATS:一个集成人类感知的开放数据集,应用于自动语音识别度量的评估。 164-175 弗兰蒂斯克·肯尼奇 , 金德里奇·桑斯克 , 彼得·塞尔瓦 , 卢卡斯·马特尤 :
使用优化的SE-ResNet架构进行在线说话人日记。 176-187 弗雷德里科·奥利维拉 , 爱德森·卡萨诺娃 , 阿纳多·坎迪多·朱尼尔 , 安德森·达席尔瓦·索尔斯 , 阿林多·加尔文·菲略 :
CML-TTS:一个用于低资源语言语音合成的多语言数据集。 188-199 扬·努扎 , 卢卡斯·马特尤 , 彼得·塞尔瓦 , 金德里奇·桑斯克 :
挪威开发最先进的端到端ASR。 200-213 金德里奇·马图塞克 , 丹尼尔·蒂埃尔卡 :
VITS:质量与速度分析。 214-225 胡安·卡米洛·瓦斯克·科雷亚 , 哈里兹·阿泽卢斯 , 胡安·马丁·多纳斯 , 约阿金·阿雷拉诺 , 安德尔·冈萨雷斯-多卡萨尔 , 艾托·阿尔瓦雷斯 :
When Whisper Meet TTS:仅使用合成语音数据的域自适应。 226-238 拉尔斯·福莫 , 丹·布鲁恩·麦金德 , 西班牙Løkke , 哈桑·奥古尔 :
空中交通管制环境下语音自动识别的无监督学习。 239-248 娜塔莉亚·卡拉什尼科娃 , 马蒂尔德·胡廷 , 瓦西列斯库 , 劳伦斯·德维勒 :
法语机器人引导语音中人类相似性的影响:语速和流利性研究。 249-257 胡安·马丁·多纳斯 , 哈里兹·阿泽卢斯 , 艾托·阿尔瓦雷斯 , 约阿金·阿雷拉诺 :
一种基于树聚类和贝叶斯重分的流应用程序在线分片方法。 258-269 弗雷德里科·奥利维拉 , 卡萨诺瓦浓缩咖啡 , 阿纳多·坎迪多·朱尼尔 , 卢卡斯·格里斯 , 安德森·达席尔瓦·索尔斯 , 阿林多·加尔文·菲略 :
MOS预测的语音表示评估。 270-282 Soumyajit Mitra公司 , 斯瓦扬布·纳特·雷 , 巴拉特·巴迪 , 拉格汉德拉·比尔吉 , 哈利什·阿西克尔 , 沙利尼·戈什 , 阿杰·斯里尼瓦萨穆尔西 , 斯里·加里梅拉 :
多域多设备ASR系统的统一建模。 283-292 莉莉·瓦杜克斯 , 内莉·巴博特 , 乔纳森·切韦鲁 , 达米安·洛维 :
语音克隆治疗嗓音障碍:语音内容的影响。 293-303 劳尔·蒙泰罗 , 迪奥戈·佩恩斯 :
走向端到端的演讲到文本总结。 304-316 乔治奥斯·卡拉卡西迪斯 , 纳撒尼尔·R·罗宾逊 , 雅罗斯拉夫·盖特曼 , 阿提亚诺·奥加约 , Ragheb Al-Ghezi公司 , 安娜亚·阿亚西 , 渡边信治 , 大卫·R·莫滕森 , 米科·库里莫 :
重音ASR的多语言TTS重音印象。 317-327 扬·莱赫卡 , 约瑟夫·普苏特卡 , 约瑟夫·普苏特卡 :
将基于变换器的语音识别模型的学习从捷克语转移到斯洛伐克语。 328-338 克里斯蒂安·迪奥斯·乌雷戈 , 丹尼尔·埃斯科巴尔·格里塞尔 , 圣地亚哥安德烈斯·莫雷诺-阿塞维多 , 保拉·安德烈亚·佩雷斯-托罗 , 埃尔马尔·诺思 , 胡安·拉斐尔·奥罗斯科·阿罗亚夫 :
基于语音分析的非母语英语语音自动评估。 339-348 圣地亚哥安德烈斯·莫雷诺-阿塞维多 , 克里斯蒂安·迪奥斯·乌雷戈 , 胡安·卡米洛·瓦斯克·科雷亚 , 简·鲁兹 , 埃尔马尔·诺思 , 胡安·拉斐尔·奥罗斯科·阿罗亚夫 :
帕金森病分类背景下使用主动学习的语言泛化。 349-359
![](https://dblp.dagstuhl.de/img/cog.dark.24x24.png)