×

关于使用Liouville混合模型平滑多项式估计及其应用。 (英语) Zbl 1284.68510号

摘要:近年来,基于统计模型的模式识别、数据挖掘和知识发现取得了重大进展。尤其是,生成模型被广泛使用,并且在整体性能方面非常可靠。这些模型的成功取决于其构建表示的能力,该表示能够捕获数据的潜在统计分布。在本文中,我们主要关注计数数据建模。实际上,这种数据是在许多上下文和不同的应用程序域中自然生成的。通常,在这种情况下,使用基于多项式假设的模型可能有几个缺点,特别是在高维稀疏数据的情况下。然后,我们提出了一种利用贝塔-刘维尔分布的混合来平滑多项式的原则方法,通过理论解释和实验验证,贝塔-刘维尔分布能够反映和建模关于多项式参数的先验信念,我们认为,所提出的平滑模型具有足够的通用性和灵活性,可以精确表示计数数据。

MSC公司:

68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Brodley CE,Smyth P(1997),在实践中应用分类算法。统计计算7(1):45-56·doi:10.1023/A:1018557312521
[2] Bouguila N,Ziou D,Vaillancourt J(2003)基于Dirichlet分布的新型混合物:在数据和图像分类中的应用。在:Perner P,Rosenfeld A(编辑)模式识别中的机器学习和数据挖掘(MLDM)。LNAI,第2734卷。柏林施普林格,172-181页·Zbl 1029.68562号
[3] Vijaya PA,Murty MN,Subramanian DK(2006)蛋白质序列的高效基于中值的聚类和分类技术。图形分析应用程序9(2-3):243-255·doi:10.1007/s10044-006-0040-z
[4] Dagan I,Lee L,Perrira FCN(1999)基于相似性的单词共现概率模型。马赫数学习34(1-3):43-69·Zbl 0928.68111号 ·doi:10.1023/A:1007537716579
[5] Scott S,Matwin S(1999)文本分类的特征工程。摘自:机器学习国际会议记录,第379-388页
[6] Csurka G、Dance CR、Fan L、Willamowski J、Bray C(2004)《关键点袋视觉分类》。参加:第八届欧洲计算机视觉会议计算机视觉统计学习研讨会·Zbl 0972.68707号
[7] Leung T,Malik J(2001)使用三维纹理表示和识别材料的视觉外观。国际J计算机视觉43(1):29-44·Zbl 0972.68606号 ·doi:10.1023/A:101126920638
[8] Bouguila N,ElGuebaly W(2009)使用有限混合模型的离散数据聚类。图案识别42(1):33-42·Zbl 1162.68598号 ·doi:10.1016/j.patcog.2008.06.022
[9] Cheng BYM,Carbonell JG,Klein-Seetharaman J(2005)基于文本文档分类技术的蛋白质分类。保护结构功能生物信息58:955-970·doi:10.1002/port.20373
[10] Witten IH,Bell TC(1991)零频率问题:估计自适应文本压缩中新事件的概率。IEEE传输信息理论37(4):1085-1094·doi:10.1109/18.87000
[11] Fienberg SE,Holland PW(1973)《多项式单元概率的同时估计》。美国统计协会杂志68(343):683-691·Zbl 0267.62030号 ·doi:10.1080/01621459.1973.10481405
[12] Hall P,Titterington DM(1987)关于平滑稀疏多项式数据。澳大利亚J Stat 29(1):19-37·Zbl 0628.62039号 ·doi:10.1111/j.1467-842X.1987.tb00717.x
[13] Simonoff JS(1995),平滑分类数据。J Stat Plann推断47:41-69·Zbl 0832.62053号 ·doi:10.1016/0378-3758(94)00121-B
[14] Bouguila N,Ziou D(2007)有限离散混合物的无监督学习:纹理建模和图像数据库摘要的应用。J Vis Commun图像代表18(4):295-309·doi:10.1016/j.jvcir.2007.02.005
[15] Bouguila N,Ziou D(2004)基于广义Dirichlet分布的强大有限混合模型:无监督学习和应用。第17届模式识别国际会议(ICPR)论文集,第280-283页·Zbl 1222.68226号
[16] Bouguila N,Ziou D(2004)基于狄利克雷的概率模型应用于人体皮肤检测。在:IEEE声学、语音和信号处理国际会议(ICASSP),第521-524页
[17] Bouguila N,Ziou D,Hammoud RI(2009),关于通过大城市的有限广义Dirichlet混合物的Bayesian分析-吉布斯抽样。模式分析应用12(2):151-166·doi:10.1007/s10044-008-0111-4
[18] McLachlan GJ,Peel D(2000)有限混合模型。纽约威利·Zbl 0963.62061号
[19] Hoare Z(2008)《朴素贝叶斯分类器的景观》。模式分析应用11(1):59-72·doi:10.1007/s10044-007-0079-5
[20] Andrés-Ferrer J,Juan A(2010)《朴素贝叶斯文本分类的约束域最大似然估计》。模式分析应用13(2):189-196·Zbl 1426.62179号 ·doi:10.1007/s10044-009-0149-y
[21] Goodman LA(1970)定性数据的多变量分析:多种分类之间的相互作用。美国统计协会杂志65(329):226-256·网址:10.1080/01621459.1970.10481076
[22] Goodman LA(1971)《多维列联表分析:建立多分类模型的逐步程序和直接估计方法》。技术计量学13(1):33-61·Zbl 0218.62066号 ·doi:10.1080/00401706.1971.10488753
[23] Goodman LA(1964)多维列联表中的相互作用。数学年鉴35(2):632-646·Zbl 0136.40803号 ·doi:10.1214/aoms/1177703561
[24] Gart JJ,Zweifel JR(1967)关于logit的各种估计值的偏差及其方差在定量生物测定中的应用。生物特征54(1/2):181-187·Zbl 0163.14601号 ·doi:10.2307/2333861
[25] Grizzle JE,Starmer CF,Koch GG(1969)线性模型分类数据分析。生物计量学25(3):489-504·Zbl 1149.62317号 ·doi:10.2307/2528901
[26] Bouguila N,Ziou D(2004)使用有限多项式Dirichlet混合改进基于内容的图像检索系统。摘自:IEEE信号处理机器学习(MLSP)研讨会论文集,第23-32页·Zbl 1149.62317号
[27] Bouguila N(2007)空间彩色图像数据库摘要。参加:IEEE声学、语音和信号处理国际会议(ICASSP),第1卷,美国夏威夷州火奴鲁鲁,第953-956页·兹伯利0163.14601
[28] Good IJ,Bayesian A(1967)多项分布的显著性检验(带讨论)。J R统计Soc B 29(3):399-431·Zbl 0162.21701号
[29] Fienberg SE(1972)关于估计多项式概率的平坦常数的选择。多变量分析杂志2(1):127-134·Zbl 0236.62047号 ·doi:10.1016/0047-259X(72)90014-0
[30] Lidstone GJ(1920)关于归纳或后验概率的Bayes-Laplace公式的一般情况的注释。Trans-Fac法案8:182-192
[31] Jeffreys J(1961)《概率论》。第3版。牛津克拉伦登出版社·Zbl 0116.34904号
[32] Perks W(1947)关于逆概率的一些观察,包括一个新的无差异规则(带讨论)。J Inst精算师73:285-334·Zbl 0031.06001号
[33] Bouguila N,Ziou D,Vaillancourt J(2004)基于Dirichlet分布的有限混合模型的无监督学习及其应用。IEEE Trans-Image处理13(11):1533-1543·doi:10.1109/TIP.2004.834664
[34] Lochner RH(1975)贝叶斯寿命试验中的广义Dirichlet分布。J R统计社会学B 37:103-113·Zbl 0297.62076号
[35] Bouguila N,ElGuebaly W(2008),《离散数据聚类》,载于《亚太知识发现和数据挖掘会议论文集》(PAKDD)。LNCS,第5012卷。大阪施普林格,第503-510页·Zbl 1162.68598号
[36] Fang KT,Kotz S,Ng KW(1990)《对称多元及相关分布》。查普曼和霍尔,纽约·Zbl 0699.62048号
[37] Bouguila N,Ziou D(2005)使用有限Dirichlet混合模型的无监督学习改进模式识别应用。图案识别快报26(12):1916-1925·doi:10.1016/j.patrec.2005.03.016
[38] Bouguila N,Ziou D,Monga E(2006)通过吉布斯抽样对有限贝塔混合物的实用贝叶斯估计及其应用。统计计算16(2):215-225·doi:10.1007/s11222-006-8451-7
[39] Robbins HE(1956)统计学的经验贝叶斯方法。收录:Neyman J(ed)《第三届伯克利数理统计与概率研讨会论文集》,第1卷,第157-163页·Zbl 0074.35302号
[40] Robbins HE(1964)统计学的经验贝叶斯方法。Ann数学统计35(1):1-20·兹伯利0138.12304 ·doi:10.1214/aoms/1177703729
[41] Deely JJ,Lindley DV(1981)贝叶斯经验贝叶斯。美国统计协会杂志76(376):833-841·Zbl 0495.62009号 ·doi:10.1080/01621459.1981.1047731
[42] Carlin BP,Louis TA(2000),数据分析的贝叶斯和经验贝叶斯方法,第2版。查普曼和霍尔/CRC,博卡拉顿·Zbl 1017.62005年
[43] McLachlan JG,Krishnan T(1997)EM算法和扩展。威利·Zbl 0882.62012号
[44] Hu T,Sung SY(2005)用混合EM方法聚类空间数据。模式分析应用程序8(1-2):139-148·doi:10.1007/s10044-005-0251-8
[45] Bouguila N,Ziou D(2007)基于最小消息长度的有限广义狄利克雷混合模型的高维无监督选择和估计。IEEE Trans-Pattern Ana Mach Intell 29(10):1716-1731·doi:10.1109/TPAMI.2007.1095
[46] Rissanen J(1978)《最短数据描述建模》。自动化14:465-471·Zbl 0418.93079号 ·doi:10.1016/0005-1098(78)90005-5
[47] Dhillon IS,Modha DS(2001)使用聚类对大型稀疏文本数据进行概念分解。《马赫学习》42(1-2):143-175·Zbl 0970.68167号 ·doi:10.1023/A:1007612920971
[48] Lebanon G,Lafferty J(2004)多项式流形上的超平面边缘分类器。摘自:机器学习国际会议记录,第66-73页
[49] Vapnik VN(1998)统计学习理论。纽约威利·Zbl 0935.62007号
[50] 张德,陈X,李WS(2005)多项式流形上带核的文本分类。摘自:第28届ACM SIGIR信息检索研究与开发国际年会(SIGIR)会议记录,第266-273页·Zbl 0297.62076号
[51] Jebara T,Kondor R,Howard A(2004)概率产品内核。J Mach学习研究5:819-844·Zbl 1222.68226号
[52] Moreno PJ,Ho PP,Vasconcelos N(2003)多媒体应用中基于Kullback-Leibler散度的SVM分类核。主题:神经信息处理系统(NIPS)进展。麻省理工学院出版社,剑桥
[53] Topsoe F(2000)信息分歧的一些不平等和相关的歧视措施。IEEE传输信息理论46(4):1602-1609·Zbl 1003.94010号 ·doi:10.109/18.850703
[54] Chapelle O,Haffner P,Vapnik VN(1999)基于直方图的图像分类的支持向量机。IEEE Trans神经网络10(5):1055-1064·数字对象标识代码:10.1109/72.788646
[55] Varma M,Zisserman A(2002)《材料图像分类:实现视点和照明独立性》。摘自:《欧洲计算机视觉会议记录》,第255-271页·Zbl 1039.68738号
[56] Szczypiñski PM,Strzelecki M,Materka A,Klepaczko A(2009)MaZda:图像纹理分析软件包。生物识别程序计算方法94(1):66-76·doi:10.1016/j.cmpb.2008.05
[57] Zhu SC,Wu Y,Mumford D(1998)过滤器,随机场和最大熵(FRAME):走向纹理建模的统一理论。国际J计算机视觉27(2):107-126·doi:10.1023/A:1007925832420
[58] Varma M,Zisserman A(2009)使用图像补丁样本进行材料分类的统计方法。IEEE跨模式分析-马赫积分31(11):2032-2047·doi:10.1109/TPAMI.2008.182
[59] Dana KJ、van Ginneken B、Nayar SK、Koenderink JJ(1999)《真实世界曲面的反射和纹理》。ACM Trans图形18(1):1-34·数字对象标识代码:10.1145/300776.300778
[60] Lazebnik S,Schmid C,Ponce J(2005)使用局部仿射区域的稀疏纹理表示。IEEE Trans-Pattern Ana Mach Intell 27(8):1265-1278·Zbl 1084.60019号 ·doi:10.1109/TPAMI.2005.151
[61] Grzegorzek M(2010)基于3D纹理的概率对象识别系统及其应用。模式分析应用程序13(3):333-348·doi:10.1007/s10044-009-0163-0
[62] Schiele B,Pentland A(1999),概率物体识别和定位。摘自:IEEE计算机视觉国际会议(ICCV)论文集,第177-182页
[63] Amsaleg L,Gros P(2001)《使用局部描述符的基于内容的检索:从数据库角度来看的问题》。图形分析应用程序4(2-3):108-124·Zbl 0972.68707号 ·doi:10.1007/s100440170011
[64] Caputo B,Wallraven C,Nilsback M-E(2004),通过局部核进行对象分类。摘自:第17届模式识别国际会议(ICPR)论文集,第132-135页
[65] Lyu S(2005)具有局部特征的目标识别的Mercer核。摘自:IEEE计算机视觉和模式识别会议记录,第223-229页
[66] Deselaers T、Keysers D、Ney H(2005)使用图像补丁进行物体识别的鉴别训练。摘自:IEEE计算机视觉和模式识别会议记录,第157-162页
[67] Loupias E,Sebe N,Bres S,Jolion J(2000)基于小波的图像检索显著点。摘自:IEEE图像处理国际会议(ICIP)论文集,第518-521页
[68] Linde Y,Buzo A,Gray RM(1980)矢量量化设计的一种算法。IEEE跨通信28:84-95·doi:10.1109/TCOM.1980.1094577
[69] Nene SA、Nayar SK、Murase H(1996)哥伦比亚物体图像库(COIL-20)。哥伦比亚大学技术报告CUCS-005-96
[70] Nene SA、Nayar SK、Murase H(1996)哥伦比亚物体图像库(COIL-100)。哥伦比亚大学技术报告CUCS-006-96
[71] Weber M、Welling M、Perona P(2000),对象模型和识别的无监督学习。摘自:《欧洲计算机视觉会议记录》,第18-32页
[72] Bouguila N,Ziou D(2010)用于比例数据建模的广义Dirichlet分布的Dirichle过程混合。IEEE Trans Neural Netw 21(1):107-122·doi:10.1109/TNN.2009.2034851
[73] Bouguila N(2009)使用MAP和随机复杂性进行离散数据聚类和特征加权的基于模型的方法。IEEE Trans Knowl Data Eng 21(12):1649-1664·doi:10.1010/TKDE.2009.42
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。