此网站使用饼干、标记和跟踪设置,以存储有助于提供最佳浏览体验的信息。 消除此警告
作者:
盖萨·内梅特 布达佩斯科技经济大学电信和远程信息处理系,1117 Bp。Magyar tudósokörütja 2。

在中搜索Géza Németh的其他论文
当前站点
谷歌学者
公共医学
关闭
萨巴·扎因科 布达佩斯科技经济大学电信和远程信息处理系,1117 Bp。Magyar tudósokörütja 2号机组

搜索Csaba Zainkóin的其他论文
当前站点
谷歌学者
公共医学
关闭
完全访问权限

创建匈牙利电子邮件阅读器的实际挑战启动了我们的统计文本分析工作。起点是文本语言自动识别的统计分析。后来它被扩展到自动重新生成变音符号和更详细的语言结构分析。对三种不同语言(匈牙利语、德语和英语)进行平行研究,使用相似大小的文本语料库,可以探索相似性和差异性。使用了可公开获取的互联网资源的公司。所有语言的语料库大小都相同(约20Mbytes,25-350万单词形式)。除了传统的语料库覆盖率、字长和出现次数统计外,还计算了韵律边界的一些新特征(句子的起始位置和结束位置,逗号前后)。除此之外,研究发现,在40-85%的覆盖范围内,语料库中最常见单词的覆盖率对所有语言都遵循平行对数规则,这就是语言学中的Zipf定律。英语和德语的函数比匈牙利语的函数更接近。还得出了进一步的结论。文中详细讨论了语言检测和变音符号再生的应用,以及对匈牙利语语音生成的影响。此外,还可以预见各种进一步的应用领域,如预测文本输入、单词连字、语音识别中的语言建模、基于体的语音合成等。

  • [1] Dafydd Gibbon-Roger Moore-Richard Winski 1998年。口语特征。Mouton de Gruyter,海牙。

    口语特征 , ().

  • 古腾堡项目。

  • (HTTP://WWW.GUTENBERG.AOL.DE)

  • [hel]匈牙利电子图书馆。

  • (HTTP://WWW.MEK.IIF.HU)

  • [kat]卡托利库斯·比布利亚。

  • (HTTP://WWW.EXTRA.HU/zentiras)

  • [2] 基尔加里夫,亚当,2002年。BNC数据库和词频列表。

  • (HTTP://WWW.ITRI.BTON.AC.UK/~Adam.Kilgarriff/BNC-README.HTML)

  • 詹姆斯国王的圣经。

  • (HTTP://WWW2.CCIM.ORG/BIBLE/DCB.HTML)

  • [3] 李文田,2002。参考Zipf定律的书目。

  • (HTTP://LINKAGE.ROCKEFELLER.EDU/WLI/ZIPF/)

  • [4] Németh,Géza-Csaba Zainkó,2001年。基于词单元的文本语料库多语种对比分析。收录于:《欧洲演讲会论文集》20012035-8。丹麦奥尔堡。

    '基于词单元的文本语料库多语种对比分析 ' , .

  • [am]美国标准版圣经。

  • (HTTP://EBIBLE.ORG/BIBLE/ASV)

  • [dig]数字图书馆学院。

  • (HTTP://ALFRED.NEUMANN-HAZ.HU)

  • 埃尔伯费尔德圣经。

  • (HTTP://HEILIGE-SCHRIFT.SYTES.NET)

  • [5] Németh,Géza-Csaba Zainkó-LászlóFekete-Gábor Olaszy-Gаbor Endrédi-Péter Olaszi-Gézza Kiss-Pèter Kis 2000。匈牙利电子邮件阅读器的设计、实现和操作。摘自:《国际语音技术杂志》3:217-36。

    匈牙利电子邮件阅读器的设计、实现和操作 , ()217 -36 .

    • 搜索谷歌学者
  • [6] Popescu,Ioan-Iovitz 2002年。关于拉瓦莱特非线性齐夫定律。

  • (HTTP://WWW.GEOCITIES.COM/IIPOPESCU/Zipfs_LAW.HTML)

  • [7] Roukos,Salim,1996年。语言表达。收录:Ronald A.Cole-Joseph Mariani-Hans Uszkoreit-Annie Zaenen-Victor Zue(编辑)人类语言技术现状调查。剑桥大学出版社,剑桥。

    语言表达 , ().

  • (HTTP://CSLU.CSE.OGI.EDU/HLT#SURVEY/CH1NODE8.HTML#SECTION16)

  • [8] Petr Sojka,1995年。TEX中复合词连字符的注释。收录:《TUG’95学报》,1995年9月,290-6。

    TEX中复合词连字符的注意事项 , ()290 -6 .

  • [9] 瓦拉迪,塔马斯,1999年。关于开发匈牙利国家语料库。摘自:《佩拉·文塔尔(编辑)语言技术-多语言方面研讨会论文集》,第32届欧洲语言学会年会,斯洛文尼亚卢布贾纳,57-63。卢布尔雅那大学艺术学院。

    关于匈牙利民族语料库的开发 , ().

  • 折叠
  • 展开

编辑委员会

  • 安妮·阿贝尔
  • 贾·埃尔伊科·博什科维奇
  • 马塞尔·登·迪肯
  • 汉斯·马丁·加特纳
  • 埃利·范·盖尔德伦
  • 安德斯·霍姆伯格
  • Katarzyna Jaszczolt公司
  • 伊斯特万·凯内西
  • 阿尼科·利普塔克
  • 卡塔林·马迪
  • 基里恩·米勒
  • Csaba Pléh公司
  • 詹保罗·萨尔维
  • 伊琳娜·塞克里纳
  • 佩特尔·斯普塔尔
  • 格雷戈里·斯塔姆
  • 彼得·斯维诺纽斯
  • 安妮·塔姆
  • 渡边明
  • 耶鲁安

语言学院学报
地址:Benczür u.33。匈牙利布达佩斯HU–1068
电话:(+36 1)351 0413;(+36 1)321 4830转154
传真:(36 1)322 9297
电子邮件:ala@nytud.mta.hu

索引和抽象服务:

  • 艺术与人文科学引文索引
  • 书目语言学/语言学书目
  • 国际书目IBZ和IBR
  • 语言学摘要
  • 语言学与语言行为摘要
  • 现代语言学会国际书目
  • 斯科普斯
  • 社会科学引文索引
  • 语言列表

 

匈牙利语言学学报
语言 英语
大小  

基础
1951
出版物
计划
更改了标题

每年
 
问题
每年
 
创始人 Magyar Tudományos Akadémia公司
创始人的
地址
H-1051匈牙利布达佩斯,Széchenyi István tér 9。
出版商 阿卡德迈艾基多
出版商的
地址
H-1117布达佩斯,匈牙利1516布达佩斯,邮政信箱245。
负责人
出版商
首席执行官Akadémiai Kiadó
ISSN公司 1216-8076(打印)
ISSN公司 1588-2624(在线)