托米·绍希恩(Tommi Jauhiainen)
人员信息
附属: 芬兰赫尔辛基大学
优化列表
2020年–今天
2023 [j3] 克里斯特·林登 , 托米·绍希恩(Tommi Jauhiainen) , 萨姆·哈德威克 :
FinnSentment:一个芬兰社交媒体语料库,用于情感极性注释。 语言资源。 评价 57 ( 2 ) : 581-609 ( 2023 ) [公元24年] 海蒂·姚海宁(Heidi Jauhiainen) , 托米·绍希恩(Tommi Jauhiainen) :
埃及象形文字的自动分词。 DH(决断高度) 2023 【c23】 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 :
针对瓜拉尼语代码切换分析调整HeLI-OTS。 伊比利亚LEF@九月 2023 [公元22年] 诺米·阿埃普利 , 圣阿格里·乔尔特金 , 罗布·范德古特 , 托米·绍希恩(Tommi Jauhiainen) , 穆拉赫·卡扎兹 , 尼古拉·卢贝西奇 , Kai North公司 , 芭芭拉·普朗克 , 伊夫·谢勒 , 马科斯·赞佩里 :
2023年VarDial评估活动的结果。 EACL的VarDial 2023 : 251-261 [电子2] 伊夫·谢勒 , 托米·绍希恩(Tommi Jauhiainen) , 尼古拉·卢贝西奇 , 普雷斯拉夫·纳科夫 , 约格·蒂德曼 , 马科斯·赞佩里 :
第十届类似语言、变体和方言自然语言处理研讨会, EACL的VarDial 2023年,克罗地亚杜布罗夫尼克,2023年5月5日。 计算语言学协会 2023 ,国际标准图书编号 978-1-959429-50-0 [目录] [i8] 马科斯·赞佩里 , Kai North公司 , 托米·绍希恩(Tommi Jauhiainen) , 玛丽亚诺·费利塞 , 内哈·库马里 , Nishant Nair公司 , 亚什·班格拉 :
用真标签识别语言变体。 CoRR公司 abs/2303.01490 ( 2023 ) [i7] 诺米·阿埃普利 , 圣阿格里·乔尔特金 , 罗布·范德古特 , 托米·绍希恩(Tommi Jauhiainen) , 穆拉赫·卡扎兹 , 尼古拉·卢贝西奇 , Kai North公司 , 芭芭拉·普朗克 , 伊夫·谢勒 , 马科斯·赞佩里 :
2023年VarDial评估活动的结果。 CoRR公司 abs/2305.20080 ( 2023 ) 2022 【c21】 尤特·迪克曼 , Mietta Lennes公司 , 尤西·皮伊图莱宁 , 杰基·尼米 , 埃里克·阿克塞尔森 , 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 :
芬兰语言库的出版资源管道。 CLARIN年会 2022 : 33-43 [公元20年] 托米·绍希恩(Tommi Jauhiainen) , 尤西·皮伊图莱宁 , 埃里克·阿克塞尔森 , 克里斯特·林登 :
作为芬兰语言银行文本语料库创建管道的一部分的语言识别。 DHNB公司 2022 : 251-259 [第19条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 :
HeLI OTS,现成的文本语言标识符。 LREC公司 2022 : 3912-3922 [第18条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 :
优化朴素贝叶斯用于阿拉伯语方言识别。 WANLP@EMNLP公司 2022 : 409-414 2021 [第17条] 巴拉提·拉贾·查克拉瓦尔蒂 , 米哈拉·加曼 , 拉杜·都铎·伊奥内斯库 , 海蒂·姚海宁(Heidi Jauhiainen) , 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 尼古拉·卢贝西奇 , 尼科·帕塔宁 , 鲁巴·普里雅德哈西尼 , 克里斯托夫·帕奇克 , 拉贾戈帕尔·埃斯瓦里 , 伊夫·谢勒 , 马科斯·赞佩里 :
2021年VarDial评估活动的结果。 EACL的VarDial 2021 : 1-11 [第16条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 :
罗马尼亚方言识别中基于朴素贝叶斯的实验。 EACL的VarDial 2021 : 76-83 [第15条] 托米·绍希恩(Tommi Jauhiainen) , 塔林杜·拉纳辛格 , 马科斯·赞佩里 :
德拉威语识别方法的比较。 EACL的VarDial 2021 : 120-127 [电子1] 马科斯·赞佩里 , 普雷斯拉夫·纳科夫 , 尼古拉·卢贝西奇 , 约格·蒂德曼 , 伊夫·谢勒 , 托米·绍希恩(Tommi Jauhiainen) :
第八届类似语言、变体和方言NLP研讨会会议记录, EACL的VarDial 2021年4月20日,乌克兰基辅。 计算语言学协会 2021 ,国际标准图书编号 978-1-954085-12-1 [目录] [i6] 托米·绍希恩(Tommi Jauhiainen) , 塔林杜·拉纳辛格 , 马科斯·赞佩里 :
德拉威语识别方法的比较。 CoRR公司 abs/2103.05552 ( 2021 ) 2020 [第14条] 海蒂·姚海宁(Heidi Jauhiainen) , 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 :
为少数民族语言构建Web语料库。 LREC的WAC 2020 : 23-32 [第13条] 马蒂亚斯·林格伦 , 托米·绍希恩(Tommi Jauhiainen) , 米科·库里莫 :
发布工具包并比较不同口语识别数据集的语言嵌入性能。 INTERSPEECH公司 2020 : 467-471 [第12条] 米哈拉·加曼 , 德克·霍维 , 拉杜·都铎·伊奥内斯库 , 海蒂·姚海宁(Heidi Jauhiainen) , 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 尼古拉·卢贝西奇 , 尼科·帕塔宁 , 克里斯托夫·帕奇克 , 伊夫·谢勒 , 马科斯·赞佩里 :
2020年VarDial评估活动报告。 COLING的VarDial 2020 : 1-14 [第11条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 尼科·帕塔宁 , 克里斯特·林登 :
Uralic Language Identification(ULI)2020共享任务数据集和Wanca 2017语料库。 COLING的VarDial 2020 : 173-185年 [第10条] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 :
语言多样性地理位置和方言识别实验。 COLING的VarDial 2020 : 220-231 [i5] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 尼科·帕塔宁 , 克里斯特·林登 :
Uralic Language Identification(ULI)2020共享任务数据集和Wanca 2017语料库。 CoRR公司 abs/2008.12169 ( 2020 ) [i4] 克里斯特·林登 , 托米·绍希恩(Tommi Jauhiainen) , 萨姆·哈德威克 :
FinnSentment-芬兰社交媒体语料库,用于情感极性注释。 CoRR公司 abs/2012.02613 ( 2020 )
2010 – 2019
2019 [注2] 托米·绍希恩(Tommi Jauhiainen) , 马可·路易斯 , 马科斯·赞佩里 , 蒂莫西·鲍德温 , 克里斯特·林登 :
文本中的自动语言识别:综述。 J.阿蒂夫。 智力。 物件。 65 : 675-782 ( 2019 ) [j1] 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) :
语言模型适应,用于文本的语言和方言识别。 自然语言工程。 25 ( 5 ) : 561-583 ( 2019 ) [i3] 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , Tero Alstola公司 , 克里斯特·林登 :
楔形文字的语言和方言识别。 CoRR公司 abs/1903.01891 ( 2019 ) [i2] 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) :
语言模型改编与文本的方言识别。 CoRR公司 abs/1903.10915 ( 2019 ) 2018 【c9】 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 :
迭代语言模型适配用于印欧语言识别。 COLING的VarDial 2018 2018 : 66-75 【c8】 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 :
基于HeLI的区分荷兰语和佛兰德斯语字幕的实验。 COLING的VarDial 2018 2018 : 137-144 【c7】 托米·绍希恩(Tommi Jauhiainen) , 海蒂·姚海宁(Heidi Jauhiainen) , 克里斯特·林登 :
基于HeLI的瑞士德语方言识别实验。 COLING的VarDial 2018 2018 : 254-262 [i1] 托米·绍希恩(Tommi Jauhiainen) , 马可·路易斯 , 马科斯·赞佩里 , 蒂莫西·鲍德温 , 克里斯特·林登 :
文本中的自动语言识别:综述。 CoRR公司 腹肌/1804.08186 ( 2018 ) 2017 【c6】 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) :
评估使用285种语言的语言识别方法。 诺达利达 2017 : 183-191 【c5】 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) :
用非线性映射评估HeLI。 VarDial(可变拨号) 2017 : 102-108 2016 【c4】 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) :
HeLI,一种用于语言识别的基于单词的退避方法。 COLING的VarDial 2016 : 153-162 2015 【c3】 托米·绍希恩(Tommi Jauhiainen) , 克里斯特·林登 , 海蒂·姚海宁(Heidi Jauhiainen) :
噪声合成多语言文档中的语言集识别。 CICLing(一) 2015 : 633-643