维特·苏霍梅尔
人员信息
优化列表
![笔记](https://dblp.org/img/note-mark.dark.12x12.png)
2020年–今天
2024 [i2] 尼古拉·卢贝西奇 , 维特·苏霍梅尔 , 彼得·鲁普尼克 , 塔贾·库兹曼 , 里克·范·诺德 :
饮食中的语言模型:通过额外的预训练为密切相关的语言开发成本效益高的编码器。 CoRR公司 abs/2404.05428 ( 2024 ) 2023 [公元25年] 马尔塔·巴尼翁 , 玛丽娜·奇奇罗 , 米奎尔·埃斯普拉-戈米斯 , 米克尔·L·福卡达 , 阿隆·加利亚诺·吉梅内斯(Aarón Galiano Jiménez) , 塔贾·库兹曼 , 尼古拉·卢贝西奇 , 里克·范诺德 , 利奥波多·普拉·森佩雷 , 杰玛·拉米雷斯-桑切斯 , 彼得·鲁普尼克 , 维特·苏霍梅尔 , 安东尼奥·托拉尔 , 杰姆·萨拉戈萨·伯纳乌 :
MaCoCu:单语和双语数据的大量收集和管理:关注源代码不足的语言。 EAMT公司 2023 : 505-506 2022 [公元24年] 马尔塔·巴尼翁 , 米奎尔·埃斯普拉-戈米斯 , 米克尔·L·福卡达 , 克里斯蒂安·加西亚·罗梅罗 , 塔贾·库兹曼 , 尼古拉·卢贝西奇 , 里克·范诺德 , 利奥波多·普拉·森佩雷 , 杰玛·拉米雷斯-桑切斯 , 彼得·鲁普尼克 , 维特·苏霍梅尔 , 安东尼奥·托拉尔 , 托比亚斯·范德维尔夫 , 杰姆·萨拉戈萨 :
MaCoCu:单语和双语数据的大量收集和管理:关注源代码不足的语言。 EAMT公司 2022 : 301-302 【c23】 维特·苏霍梅尔 , 扬·克劳斯 :
网络语料库中主题和体裁的半手工注释,廉价快捷的方法。 RASLAN公司 2022 : 141-148 2021 [公元22年] 维特·苏霍梅尔 , 扬·克劳斯 :
与Web语料库提取文本质量相关的网站属性。 RASLAN公司 2021 : 167-175 2020 【c21】 米洛斯·雅库比切克 , Vojtech Kovár公司 , 帕维尔·里奇尔(Pavel Rychl) , 维特·苏霍梅尔 :
当前Web语料库建设面临的挑战。 LREC的WAC 2020 : 1-4 [公元20年] 维特·苏霍梅尔 :
通过监督学习和网站半年度分类从Web语料库中删除垃圾邮件。 RASLAN公司 2020 : 113-123
2010 – 2019
2019 [注2] 亚历斯·霍拉克 , 维特·贝萨 , 亚当·兰布塞克 , 维特·苏霍梅尔 :
一种半自动构建和扩展多语言术语词库的新方法。 国际艺术杂志。 因特尔。 工具 28 ( 2 ) : 1950008:1-1950008:21 ( 2019 ) [第19条] 维特·苏霍梅尔 :
使用大型Web语料库区分相似语言。 RASLAN公司 2019 : 129-135 [i1] 亚当·兰布塞克 , 亚历斯·霍拉克 , 维特·苏霍梅尔 , 维特·贝萨 :
一种半自动构建和扩展多语言术语词典的新方法。 CoRR公司 abs/1903.10921 ( 2019 ) 2018 [第18条] 维特·苏霍梅尔 :
csTenTen17,一个最近的捷克网络语料库。 RASLAN公司 2018 : 111-123 2016 [第17条] 达贾·费瑟 , 维特·苏霍梅尔 , 米洛斯·雅库比切克 :
使用草图引擎提取学术斯洛文尼亚语术语。 RASLAN公司 2016 : 135-141 [第16条] 帕维尔·里奇尔(Pavel Rychl) , 维特·苏霍梅尔 :
注释阿姆哈拉语语料库。 TSD公司 2016 : 295-302 [第15条] 昂德雷·赫尔曼 , 维特·苏霍梅尔 , 维特·贝萨 , 帕维尔·里奇尔(Pavel Rychl) :
2016年DSL共享任务:通过期望最大化和基于组块的语言模型,完美是良好语言歧视的敌人。 COLING的VarDial 2016 : 114-118 2015 [第14条] 维特·贝萨 , 维特·苏霍梅尔 :
基于语料库的超词提取。 RASLAN公司 2015 : 69-74 2014 [j1] 特雷西艺术 , 约纳坦·贝林科夫 , 尼扎尔·哈巴什 , 亚当·基尔加里夫 , 维生素苏霍梅尔 :
arTenTen:阿拉伯语语料库和单词草图。 沙特国王大学计算机系。 信息科学。 26 ( 4 ) : 357-371 ( 2014 ) [第13条] 米洛斯·雅库比切克 , 亚当·基尔加里夫 , Vojtech Kovár公司 , 帕维尔·里奇尔(Pavel Rychl) , 维特·苏霍梅尔 :
使用草图引擎在语料库中查找多种语言的术语。 EACL公司 2014 : 53-56 [第12条] Ondrej Bojar公司 , Vojtech Diatka公司 , 帕维尔·里奇尔(Pavel Rychl) , 帕维尔·斯特拉纳克 , 维特·苏霍梅尔 , 亚历斯·塔姆奇纳 , 丹尼尔·泽曼 :
HindEnCorp-机器翻译的Hindi-English和Hindi-only语料库。 LREC公司 2014 : 3550-3555 [第11条] 维特·贝萨 , 维特·苏霍梅尔 :
SkELL:英语语言学习的网络界面。 RASLAN公司 2014 : 63-70 [第10条] 简·米歇尔费特 , 扬·波米卡莱克 , 维特·苏霍梅尔 :
使用unitok进行文本标记。 RASLAN公司 2014 : 71-75 【c9】 Zuzana Neverilová , 维特·苏霍梅尔 :
捷克语短语的智能搜索和替换。 RASLAN公司 2014 : 97-105 【c8】 亚当·兰布塞克 , 亚历斯·霍拉克 , 维特·苏霍梅尔 , 露西娅·科辛科娃 :
土地测量领域术语叙词表的半自动构建和扩展。 RASLAN公司 2014 : 129-137 2013 【c7】 维特·贝萨 , 维特·苏霍梅尔 :
语料库比较的内在方法。 RASLAN公司 2013 : 51-58 2012 【c6】 维特·贝萨 , 维特·苏霍梅尔 :
检测Web Corpora中的垃圾邮件内容。 RASLAN公司 2012 : 69-76 【c5】 维生素苏霍梅尔 :
最近的捷克网络语料库。 RASLAN公司 2012 : 77-83 【c4】 古尔山·多武多夫 , 维特·苏霍梅尔 , 帕维尔·斯默克 :
走向塔吉克100M形态注释语料库。 RASLAN公司 2012 : 91-94 2011 【c3】 Gulshan Dovudov公司 , 扬·波米卡莱克 , 维特·苏霍梅尔 , 帕维尔·斯默克 :
建立一个50M的塔吉克语语料库。 RASLAN公司 2011 : 89-95 【c2】 维特·苏霍梅尔 , 扬·波米卡莱克 :
文本公司实用的网络爬行。 RASLAN公司 2011 : 97-108 【c1】 扬·波米卡莱克 , 维生素苏霍梅尔 :
chared:使用已知语言进行字符编码检测。 RASLAN公司 2011 : 125-129
合著者索引
![](https://dblp.org/img/cog.dark.24x24.png)