魏ß,Christian H。;米亚佩尔托拉 序列模式分析:序列长度和支持度的统计调查。 (英语) 兹比尔1347.62270 Commun公司。统计、仿真计算。 42,第5期,1044-1062(2013). 摘要:在序列模式分析中,模式的频率由支持评估。虽然从大型数据库中有效地计算,但我们表明,由于受实际序列长度分布的影响,无法在不同数据库之间比较支持。调查了该序列长度分布的模型。其中一种模式,即良好分配,似乎具有足够的实践灵活性。它用于举例说明调整相对支持度的方法,以便在不同数据库之间更好地比较调整后的支持度值。我们用双语FinDe语料库中的文本来说明我们的发现。 引用于1文件 MSC公司: 62页99 统计学的应用 68吨10 模式识别、语音识别 68T50型 自然语言处理 91层20 语言学 关键词:良好的分配;序列长度分布;顺序模式分析;支持;文本语料库 PDF格式BibTeX公司 XML格式引用 \textit{C.H.Weiß}和\textit{M.Peltola},公社。统计、仿真计算。42,第5号,1044--1062(2013;Zbl 1347.62270) 全文: 内政部 参考文献: [1] Agrawal R.,《第20届超大数据库国际会议论文集》,第487页–(1994年) [2] Agrawal R.,第11届国际数据工程会议记录(ICDE’95),第3页–(1995)·doi:10.1109/ICDE.1995.380415 [3] Altmann G.,Glottometrica 9,第147页–(1988) [4] 贝克M.,《文本与技术》第233页–(1993年) [5] Best K.-H.,《定量语言学杂志》8(1)pp 1–(2001)·doi:10.1076/jqul.8.1.1.4091 [6] Brill E.,第三届应用自然语言处理会议记录。第152页–(1992)·数字对象标识代码:10.3115/97449.974526 [7] Douglas J.B.,标准传染分布分析(1980)·Zbl 0435.60002号 [8] Fucks W.,《德国柏林宣言》1968年,《Vorträge und Berichte》第42页–(1970) [9] Fudos I.,《信息处理信函》57(6),第307页–(1996)·Zbl 0875.68748号 ·doi:10.1016/0020-0190(96)00022-1 [10] Grzybek P.,Anzeiger für Slavische Philologie二十七,第87页–(1999) [11] 韩礼德M.A.K.,词汇学和语料库语言学导论(2004) [12] Hotho A.,《语言技术与计算语言学杂志》25(1)第19页–(2005) [13] Jacquemont S.,《机器学习》75(1),第91页–(2009年)·Zbl 1470.68119号 ·doi:10.1007/s10994-008-5098年 [14] Kedem B.,二进制时间序列(1980)·Zbl 0424.62062号 [15] Kelih E.,《语言技术与计算语言学杂志》25(2),第31页–(2005) [16] Kolehmainen L.,芬德。Arbeiten mit dem finnisch-deutschen Kontrastkorpus,波段3(2007) [17] Kulasekera K.B.,《统计学中的通信——模拟和计算》21(2),第499页–(1992)·Zbl 0850.62164号 ·网址:10.1080/03610919208813032 [18] Laur P.,智能数据分析11(1),第29页–(2007) [19] Laxman S.,萨达纳31(2),第173页–(2006) [20] DOI:10.1023/A:1009748302351·doi:10.1023/A:1009748302351 [21] 蒙哥马利特区,《统计质量控制导论》,第5版(2005年)·Zbl 1059.62125号 [22] Németh G.,《欧洲演讲集2001》第2035页-(2001) [23] Németh G.,匈牙利语言学报49(3)第385页–(2003)·doi:10.1556/ALing.49.2002.3-4.8 [24] Peltola M.,TEI/XML-Strukturen中的Konversion des parallelen finnisch-deutschen FINDE-Korpus(2007) [25] Régnier M.,《序列的压缩和复杂性学报》,1997年,第253页–(1997) [26] 数字对象标识码:10.1111/j.0039-3193.2004.00109.x·doi:10.1111/j.0039-3193.2004.00109.x [27] TEI P5,电子文本编码和交换指南,1.4.0版(2007) [28] WeißC.H.,《质量和可靠性统计百科全书》第1719页–(2007年) [29] WeißC.H.,《统计与计算》18(2),第185页–(2008)·doi:10.1007/s11222-007-9047-6 [30] WeißC.H.,统计与计算21(1)pp 1–(2011)·Zbl 1274.62627号 ·doi:10.1007/s11222-009-9141-z [31] Wimmer G.,《定量语言学杂志》1(1),第98页–(1994)·网址:10.1080/09296179408590003 [32] 内政部:10.1109/TR.2004.823851·doi:10.1109/TR.2004.823851 [33] Zaki M.J.,《第三届形式概念分析国际会议论文集》(ICFCA 2005),第1页–(2005) [34] Zörnig P.,《计算统计与数据分析》,第19(4)页,461–(1995)·doi:10.1016/0167-9473(94)00009-8 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。