托米·绍希恩(Tommi Jauhiainen)
人员信息
附属: 芬兰赫尔辛基大学
优化列表
2020年–今天
2024 [公元25年] 马科斯·赞皮耶里 , Kai North公司 , 托米·绍希恩(Tommi Jauhiainen) , 玛丽亚诺·费利塞 , 内哈·库马里 , Nishant Nair公司 , 亚什·马赫什·班格拉 以下为:
用真标签识别语言变体。 LREC/冷却 2024 以下为: 10100-10109 2023 [j3] 克里斯特·林登 , 托米·绍希恩(Tommi Jauhiainen) , 萨姆·哈德威克 以下为:
FinnSentment:芬兰社交媒体语料库,用于情感极性注释。 语言资源。 评价 57 ( 2 ) 以下为: 581-609年 ( 2023 ) [公元24年] 海蒂·姚海宁(Heidi Jauhiainen) , 托米·绍希恩(Tommi Jauhiainen) 以下为:
埃及象形文字的自动分词。 DH(决断高度) 2023 【c23】 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 以下为:
针对瓜拉尼语代码切换分析调整HeLI-OTS。 IberLEF@SEPLN公司 2023 [公元22年] 诺米·阿埃普利 , 圣阿格里·乔尔特金 , 罗布·范德古特 , 托米·绍希恩(Tommi Jauhiainen) , 穆拉赫·卡扎兹 , 尼古拉·卢贝西奇 , Kai North公司 , 芭芭拉·普朗克 , 伊夫·谢勒 , 马科斯·赞皮耶里 以下为:
2023年VarDial评估活动的结果。 EACL的VarDial 2023 以下为: 251-261 [电子2] 伊夫·谢勒 , 托米·绍希恩(Tommi Jauhiainen) , 尼古拉·卢贝西奇 , 普雷斯拉夫·纳科夫 , 约格·蒂德曼 , 马科斯·赞皮耶里 以下为:
第十届类似语言、变体和方言自然语言处理研讨会, EACL的VarDial 2023年5月5日,克罗地亚杜布罗夫尼克。 计算语言学协会 2023 ,国际标准图书编号 978-1-959429-50-0 [目录] [i8] 马科斯·赞皮耶里 , Kai North公司 , 托米·绍希恩(Tommi Jauhiainen) , 玛丽亚诺·费利塞 , 内哈·库马里 , Nishant Nair公司 , 亚什·班格拉 以下为:
用真实标签识别语言变体。 CoRR公司 abs/2303.01490 ( 2023 ) [i7] 诺米·阿埃普利 , 圣阿格里·乔尔特金 , 罗布·范德古特 , 托米·绍希恩(Tommi Jauhiainen) , 穆拉赫·卡扎兹 , 尼古拉·卢贝西奇 , Kai North公司 , 芭芭拉·普朗克 , 伊夫·谢勒 , 马科斯·赞皮耶里 以下为:
2023年VarDial评估活动的结果。 CoRR公司 abs/2305.20080 ( 2023 ) 2022 【c21】 尤特·迪克曼 , 米埃塔·莱恩斯 , 尤西·皮伊图莱宁 , 杰基·尼米 , 埃里克·阿克塞尔森 , 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 以下为:
芬兰语言库的出版资源管道。 CLARIN年会 2022 以下为: 33-43 [公元20年] 托米·绍希恩(Tommi Jauhiainen) , 尤西·皮伊图莱宁 , 埃里克·阿克塞尔森 , 克里斯特·林登 以下为:
作为芬兰语言银行文本语料库创建管道的一部分的语言识别。 DHNB公司 2022 以下为: 251-259 [第19条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 以下为:
HeLI OTS,现成的文本语言标识符。 LREC公司 2022 以下为: 3912-3922 [第18条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 以下为:
优化朴素贝叶斯用于阿拉伯语方言识别。 WANLP@EMNLP公司 2022 以下为: 409-414 2021 [第17条] 巴拉提·拉贾·查克拉瓦尔蒂 , 米哈拉·加曼 , 拉杜·都铎·伊奥内斯库 , 海蒂·姚海宁(Heidi Jauhiainen) , 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 尼古拉·卢贝西奇 , 尼科·帕塔宁 , 鲁巴·普里雅德哈西尼 , 克里斯托夫·帕奇克 , 拉贾戈帕尔·埃斯瓦里 , 伊夫·谢勒 , 马科斯·赞皮耶里 以下为:
2021年VarDial评估活动的结果。 EACL的VarDial 2021 以下为: 1-11 [第16条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 以下为:
罗马尼亚方言识别中基于朴素贝叶斯的实验。 EACL的VarDial 2021 以下为: 76-83 [第15条] 托米·绍希恩(Tommi Jauhiainen) , 塔林杜·拉纳辛格 , 马科斯·赞皮耶里 以下为:
德拉威语识别方法的比较。 EACL的VarDial 2021 以下为: 120-127 [电子1] 马科斯·赞皮耶里 , 普雷斯拉夫·纳科夫 , 尼古拉·卢贝西奇 , 约格·蒂德曼 , 伊夫·谢勒 , 托米·绍希恩(Tommi Jauhiainen) 以下为:
第八届类似语言、变体和方言NLP研讨会会议记录, EACL的VarDial 2021年4月20日,乌克兰基辅。 计算语言学协会 2021 ,国际标准图书编号 978-1-954085-12-1 [目录] [i6] 托米·绍希恩(Tommi Jauhiainen) , 塔林杜·拉纳辛格 , 马科斯·赞皮耶里 以下为:
德拉威语识别方法的比较。 CoRR公司 abs/2103.05552 ( 2021 ) 2020 [第14条] 海蒂·姚海宁(Heidi Jauhiainen) , 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 以下为:
为少数民族语言构建Web语料库。 LREC的WAC 2020 以下为: 23-32 [第13条] 马蒂亚斯·林格伦 , 托米·绍希恩(Tommi Jauhiainen) , 米科·库里莫 以下为:
发布工具包并比较不同口语识别数据集的语言嵌入性能。 INTERSPEECH公司 2020 以下为: 467-471 [c12] 米哈拉·加曼 , 德克·霍维 , 拉杜·都铎·伊奥内斯库 , 海蒂·姚海宁(Heidi Jauhiainen) , 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 尼古拉·卢贝西奇 , 尼科·帕塔宁 , 克里斯托夫·帕奇克 , 伊夫·谢勒 , 马科斯·赞皮耶里 以下为:
2020年VarDial评估活动报告。 COLING的VarDial 2020 以下为: 1-14 [第11条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 尼科·帕塔宁 , 克里斯特·林登 以下为:
Uralic Language Identification(ULI)2020共享任务数据集和Wanca 2017语料库。 COLING的VarDial 2020 以下为: 173-185 [第10条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 以下为:
语言多样性地理位置和方言识别实验。 COLING的VarDial 2020 以下为: 220-231 [i5] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 尼科·帕塔宁 , 克里斯特·林登 以下为:
Uralic Language Identification(ULI)2020共享任务数据集和Wanca 2017语料库。 CoRR公司 abs/2008.12169 ( 2020 ) [i4] 克里斯特·林登 , 托米·绍希恩(Tommi Jauhiainen) , 萨姆·哈德威克 以下为:
FinnSentment-芬兰社交媒体语料库,用于情感极性注释。 CoRR公司 abs/2012.02613 ( 2020 )
2010 – 2019
2019 [注2] 托米·绍希恩(Tommi Jauhiainen) , 马可·路易斯 , 马科斯·赞皮耶里 , 蒂莫西·鲍德温 , 克里斯特·林登 以下为:
文本中的自动语言识别:综述。 J.人工制品。 智力。 物件。 65 以下为: 675-782 ( 2019 ) [j1] 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) 以下为:
语言模型适应,用于文本的语言和方言识别。 自然语言工程。 25 ( 5 ) 以下为: 561-583 ( 2019 ) [i3] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 特罗·阿尔斯托拉 , 克里斯特·林登 以下为:
楔形文字的语言和方言识别。 CoRR公司 abs/1903.01891 ( 2019 ) [i2] 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) 以下为:
语言模型改编与文本的方言识别。 CoRR公司 腹肌/1903.10915 ( 2019 ) 2018 【c9】 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 以下为:
迭代语言模型适配用于印欧语言识别。 COLING的VarDial 2018 2018 以下为: 66-75 【c8】 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 以下为:
基于HeLI的区分荷兰语和佛兰德斯语字幕的实验。 COLING的VarDial 2018 2018 以下为: 137-144 【c7】 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 以下为:
基于HeLI的瑞士德语方言识别实验。 COLING的VarDial 2018 2018 以下为: 254-262 [i1] 托米·绍希恩(Tommi Jauhiainen) , 马可·路易斯 , 马科斯·赞皮耶里 , 蒂莫西·鲍德温 , 克里斯特·林登 以下为:
文本中的自动语言识别:综述。 CoRR公司 abs/1804.08186 ( 2018 ) 2017 【c6】 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) 以下为:
评估使用285种语言的语言识别方法。 诺达利达 2017 以下为: 183-191 【c5】 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) 以下为:
用非线性映射评估HeLI。 VarDial(可变拨号) 2017 以下为: 102-108 2016 【c4】 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) 以下为:
HeLI,一种基于单词的语言识别退避方法。 COLING的VarDial 2016 以下为: 153-162 2015 【c3】 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) 以下为:
噪声合成多语言文档中的语言集识别。 CICLing(一) 2015 以下为: 633-643