塔尼娅·萨马尔季奇
人员信息
优化列表
2020年–今天
2024 [i4] 塔尼娅·萨马尔季奇 , 西梅娜·古铁雷斯-瓦斯克斯 , 克里斯蒂安·本茨 , 史蒂文·莫兰 , 奥尔加·佩洛尼 以下为:
多语言NLP数据集中语言多样性透明比较的度量。 CoRR公司 abs/2403.03909 ( 2024 ) 2023 [j5] 西梅娜·古铁雷斯-瓦斯克斯 , 克里斯蒂安·本茨 , 塔尼娅·萨马尔季奇 以下为:
通过BPE压缩观察窗的语言。 计算。 语言学 49 ( 4 ) 以下为: 943-1001 ( 2023 ) [公元27年] 米歇尔·普吕斯 , 简·德瑞(Jan Deriu) , 亚尼克·施拉纳 , 克劳迪奥·保尼萨 , 朱莉娅·哈特曼 , 拉里萨·施密特 , 克里斯蒂安·谢勒 , 曼努埃拉·赫利曼 , 塔尼娅·萨马尔季奇 , 曼弗雷德·沃格尔 , 马克·齐利耶巴克 以下为:
STT4SG-350:适用于所有瑞士德语方言地区的语音语料库。 ACL(2) 2023 以下为: 1763年-1772年 [c26] 瓦尼·坎吉兰加特 , 塔尼娅·萨马尔季奇 , Ljiljana Dolamic公司 , 法比奥·里纳尔迪 以下为:
方言分类中子词词汇量的优化。 EACL的VarDial 2023 以下为: 14-30 [i3] 米歇尔·普吕斯 , 简·德瑞(Jan Deriu) , 亚尼克·施拉纳 , 克劳迪奥·保尼萨 , 朱莉娅·哈特曼 , 拉里萨·施密特 , 克里斯蒂安·谢勒 , 曼努埃拉·赫利曼 , 塔尼娅·萨马尔季奇 , 曼弗雷德·沃格尔 , 马克·齐利耶巴克 以下为:
STT4SG-350:所有瑞士德语方言区的语音语料库。 CoRR公司 abs/2305.18855 ( 2023 ) 2022 [公元25年] 塔尼娅·萨马尔季奇 , 西梅娜·古铁雷斯-瓦斯克斯 , 罗布·范德古特 , 马克斯·穆勒·埃伯斯坦 , 奥尔加·佩洛尼 , 芭芭拉·普朗克 以下为:
UD解析器的语言空间、尺度和跨语言传输。 CoNLL公司 2022 以下为: 266-281 [公元24年] 瓦尼·坎吉兰加特 , 塔尼娅·萨马尔季奇 , 法比奥·里纳尔迪 , Ljiljana Dolamic公司 以下为:
方言识别的早期猜测。 EMNLP(调查结果) 2022 以下为: 6417-6426 【c23】 奥尔加·佩洛尼 , 阿纳斯塔西亚·沙塔罗娃 , 塔尼娅·萨马尔季奇 以下为:
子词均匀性(SuE)是低源语言跨语言迁移的预测因子。 EMNLP公司 2022 以下为: 7428-7445 [公元22年] 史蒂文·莫兰 , 克里斯蒂安·本茨 , 西梅娜·古铁雷斯-瓦斯克斯 , 奥尔加·佩洛尼 , 塔尼娅·萨马尔季奇 以下为:
TeDDi示例:语言比较和多语言NLP的文本数据多样性示例。 LREC公司 2022 以下为: 1150-1158 【c21】 瓦尼·坎吉兰加特 , 塔尼娅·萨马尔季奇 , Ljiljana Dolamic公司 , 法比奥·里纳尔迪 以下为:
NADI共享任务子任务1中的NLP DI:用于方言识别的子字级卷积神经模型和预训练二进制分类器。 WANLP@EMNLP公司 2022 以下为: 468-473 2021 [公元20年] 塔吉亚纳·鲁兹西克斯 , 奥尔加·索齐诺娃 , 西梅娜·古铁雷斯-瓦斯克斯 , 塔尼娅·萨马尔季奇 以下为:
形态屈折的可解释性:从特征级预测到子词级规则。 EACL公司 2021 以下为: 3189-3201 [第19条] 西梅娜·古铁雷斯-瓦斯克斯 , 克里斯蒂安·本茨 , 奥尔加·索齐诺娃 , 塔尼娅·萨马尔季奇 以下为:
从文字到文字:BPE合并的转折点。 EACL公司 2021 以下为: 3454-3468 2020 [第18条] 拉里萨·施密特 , 露西·林德 , 桑德拉·贾姆巴佐夫斯卡 , 亚历山大·拉扎里迪斯 , 塔尼娅·萨马尔季奇 , 克劳迪乌·穆萨特 以下为:
瑞士德语词典:语言和写作的变体。 LREC公司 2020 以下为: 2720-2725 [第17条] 塔农·邱 , 尤利娅·黑马图利亚(Iulia Nigmatulina) , 洛伦斯·纳盖勒 , 塔尼娅·萨马尔季奇 以下为:
UZH TILT:瑞士德语语音到标准德语文本的Kaldi食谱。 瑞士文/科文斯 2020 [第16条] 尤利娅·黑马图利亚(Iulia Nigmatulina) , Tannon邱 , 塔尼娅·萨马尔季奇 以下为:
具有方言变体的非标准化语言的ASR:以瑞士德语为例。 COLING的VarDial 2020 以下为: 15-24 [i2] 拉里萨·施密特 , 露西·林德 , 桑德拉·贾姆巴佐夫斯卡 , 亚历山大·拉扎里迪斯 , 塔尼娅·萨马尔季奇 , 克劳迪乌·穆萨特 以下为:
瑞士德语词典:语言和写作的变体。 CoRR公司 abs/2004.00139 ( 2020 )
2010 – 2019
2019 【j4】 伊夫·谢勒 , 塔尼娅·萨马尔季奇 , 埃尔维拉·格拉泽 以下为:
瑞士德语数字化:如何处理和学习多中心口语。 语言资源。 评价 53 ( 4 ) 以下为: 735-769 ( 2019 ) [j3] 塔吉亚纳·鲁兹西克斯 , 马西莫·卢塞蒂 , 安妮·哥林 , 塔尼娅·萨马尔季奇 , 伊丽莎白·斯塔克 以下为:
具有自适应解码和POS特征的神经文本规范化。 自然语言工程。 25 ( 5 ) 以下为: 585-605 ( 2019 ) [i1] 塔吉亚纳·鲁兹西克斯 , 塔尼娅·萨马尔季奇 以下为:
基于序列对序列网络和多源学习的多级文本规范化。 CoRR公司 abs/1903.11340 ( 2019 ) 2018 [注2] Curdin Derungs公司 , 塔尼娅·萨马尔季奇 以下为:
文本中经常提到突出的山脉吗? 探索文本频率的空间表达能力。 国际地质杂志。 信息科学。 32 ( 5 ) 以下为: 856-873年 ( 2018 ) [第15条] 塔尼娅·萨马尔季奇 , 马克·齐利耶巴克 , 扬·米兰·德鲁 以下为:
瑞士-德国未来行动——2018年瑞士文本研讨会结果。 瑞士文字 2018 以下为: 95-99 [第14条] 马科斯·赞皮耶里 , 谢文·马尔马西 , 普雷斯拉夫·纳科夫 , 艾哈迈德·阿里 , Suwon Shon先生 , 詹姆斯·格拉斯 , 伊夫·谢勒 , 塔尼娅·萨马尔季奇 , 尼古拉·卢贝西奇 , 约格·蒂德曼 , 克里斯·范德利 , 斯特凡·格兰德勒 , 内列克·奥斯蒂克 , 德克·斯佩尔曼 , Antal van den Bosch公司 , 里泰什·库马尔 , 博尼尼·拉希里 , 马扬克·贾恩 以下为:
语言识别和形态句法标记:第二次VarDial评估活动。 COLING的VarDial 2018 2018 以下为: 1-17 [第13条] 马西莫·卢塞蒂 , 塔吉亚纳·鲁兹西克斯 , 安妮·哥林 , 塔尼娅·萨马尔季奇 , 伊丽莎白·斯塔克 以下为:
文本规范化的编码器-解码器方法。 COLING的VarDial 2018 2018 以下为: 18-28 2017 [j1] 克里斯蒂安·本茨 , 迪米特里奥斯·阿里卡尼奥提斯 , 塔尼娅·萨马尔季奇 , 保拉·巴特里 以下为:
词频分布的变化:基于语料库的语言类型学的定义、度量和含义。 J.数量。 语言学 24 ( 2-3 ) 以下为: 128-162 ( 2017 ) [c12] 塔尼娅·萨马尔季奇 , 米尔贾娜·斯塔罗维奇 , Zeljko Agic公司 , 尼古拉·卢贝西奇 以下为:
塞尔维亚语与克罗地亚语和其他斯拉夫语的普遍依赖性比较。 EACL的BSNLP 2017 以下为: 39-44 [第11条] 塔吉亚纳·鲁兹西克斯 , 塔尼娅·萨马尔季奇 以下为:
内部单词结构的神经顺序-顺序学习。 CoNLL公司 2017 以下为: 184-194 2016 [第10条] 克里斯蒂安·本茨 , 塔吉亚纳·鲁兹西克斯 , 亚历山大·科普莱尼 , 塔尼娅·萨马尔季奇 以下为:
形态学复杂性度量的比较:类型数据与语言语料库。 冷却时的CL4LC 2016 2016 以下为: 142-153 【c9】 尼古拉·卢贝西奇 , 塔尼娅·萨马尔季奇 , Curdin Derungs公司 以下为:
TweetGeo-一个收集、处理和分析地理编码语言数据的工具。 冷却 2016 以下为: 3412-3421 【c8】 塔尼娅·萨马尔季奇 , 马贾·米利舍维奇 以下为:
从语料库自动获取克罗地亚语和塞尔维亚语动词体的框架。 LREC公司 2016 【c7】 塔尼娅·萨马尔季奇 , 伊夫·谢勒 , 埃尔维拉·格拉泽 以下为:
ArchiMob-瑞士德语口语语料库。 LREC公司 2016 2015 【c6】 塔尼娅·萨马尔季奇 , 尼古拉·卢贝西奇 , 马贾·米利舍维奇 以下为:
区域语言数据倡议(ReLDI)。 RANLP时的BSNLP 2015 以下为: 40-42 【c5】 塔尼娅·萨马尔季奇 , 罗伯特·斯科夫斯基 , 萨宾·斯托尔 以下为:
作为两级序列分类的自动行间平滑。 LaTeCH@ACL公司 2015 以下为: 68至72 2014 【c4】 诺米·阿埃普利 , 鲁普列希特·冯·瓦尔登费尔斯 , 塔尼娅·萨马尔季奇 以下为:
通过跨语言多数投票消除部分话语标记歧义。 COLING的VarDial 2014 以下为: 76-84 2012 【c3】 安德烈亚·格斯蒙多 , 塔尼娅·萨马尔季奇 以下为:
作为标记任务的引理。 ACL(2) 2012 以下为: 368-372 [c2] 安德烈亚·格斯蒙多 , 塔尼娅·萨马尔季奇 以下为:
将塞尔维亚语作为双向序列分类的类别标记。 LREC公司 2012 以下为: 2103-2106 2010 【c1】 隆内克·范德普拉斯 , 塔尼娅·萨马尔季奇 , 保拉·梅洛 以下为:
PropBank在法语手册注释中的跨语言有效性。 语言注释研讨会 2010 以下为: 113-117