文件Zbl 1473.62208-zbMATH打开

伯努利分布和范畴分布有限混合的平均场博弈模型。（英语） Zbl 1473.62208号

J.戴恩。游戏 8，编号1，35-59（2021）.

摘要：有限混合模型是数据统计分析的重要工具，例如在数据聚类中。混合模型的最佳参数通常通过期望最大化算法最大化对数似然泛函来计算。我们提出了一种基于平均场对策理论的替代方法，这是一类具有无限多个代理的微分对策。我们证明了有限状态空间多种群平均场对策系统的解刻画了Bernoulli混合物对数似然泛函的临界点。然后将该方法推广到分类分布的混合模型。因此，平均场对策方法提供了一种计算混合模型参数的方法，并且我们展示了它在聚类分析中的一些标准示例中的应用。

MSC公司：

62H30型	分类和区分；聚类分析（统计方面）
60J10型	马尔可夫链（离散状态空间上的离散时间马尔可夫过程）
49号80	平均场比赛和控制
91A16型	平均场博弈（博弈论方面）
91C20个	社会科学和行为科学中的聚类

关键词：

混合物模型;伯努利分布;分类分布;聚类分析;EM算法;平均场游戏

软件：

PRMLT公司;github;MNIST公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	L.Aquilanti、S.Cacase、F.Camilli和R.De Maio，聚类分析的平均场博弈方法，应用数学。最佳方案。, (2020).
[2]	R.Bellman，动态编程《普林斯顿数学地标》，普林斯顿大学出版社，新泽西州普林斯顿，1957年·Zbl 0077.13605号
[3]	J.A.Bilmes，《EM算法及其在高斯混合和隐马尔可夫模型参数估计中的应用的温和教程》，CTIT技术报告系列，1998年。
[4]	C.M.Bishop，模式识别与机器学习《信息科学与统计》，施普林格，纽约，2006年·Zbl 1107.68072号
[5]	A.Biswas，离散时间Markov过程的遍历代价平均场博弈，预印本，arXiv:1510.08968。
[6]	S.Cacase、F.Camilli和A.Goffi，《平均场游戏的政策迭代方法》，预印本，arXiv:2007.04818。
[7]	R.Carmona和M.Lauriere，平均场控制和博弈数值解机器学习算法的收敛性分析：I-遍历情况，预印本，arXiv:1907.05980。
[8]	J.L.科罗恩，JeuxáChamp Moyen的Quelques示例，巴黎多芬大学博士论文，2018年。可从以下位置获得：https://tel.archives-ouvertes.fr/tel-01705969/document。
[9]	W.E，J.Han和Q.Li，深度学习的平均场最优控制公式，Res.数学。科学。第6期（2019年），第41页·Zbl 1421.49021号
[10]	B.S.Everitt、S.Landau、M.Leese和D.Stahl，聚类分析《Wiley Series in Probability and Statistics》，John Wiley&Sons，Ltd.，奇切斯特出版社，2011年·Zbl 1274.62003年
[11]	时尚-MNIST.，可从以下网址获得：https://github.com/zalandoresearch/fashin-mnist。
[12]	W.H.Fleming，《一些马尔可夫优化问题》，数学杂志。机械。，12, 131-140 (1963) ·Zbl 0128.37902号
[13]	D.A.戈麦斯；J.Mohr；R.R.Souza，离散时间，有限状态空间平均场对策，J.Math。Pures应用程序。(9), 93, 308-328 (2010) ·Zbl 1192.91028号 ·doi:10.1016/j.matpur.2009.10.010
[14]	D.A.戈麦斯；J.Saúde，《平均场游戏模型——简要调查》，Dyn。游戏应用。，4, 110-154 (2014) ·Zbl 1314.91048号 ·doi:10.1007/s13235-013-0099-2
[15]	R.A.Howard，动态规划与马尔可夫过程，麻省理工学院技术出版社，马萨诸塞州剑桥。；约翰·威利父子公司，纽约-朗顿，1960年·兹比尔0091.16001
[16]	黄先生；R.P.Malhamé；P.E.Caines，《大种群随机动态博弈：闭环McKean-Vlasov系统和Nash确定性等价原理》，Commun。信息系统。，6, 221-251 (2006) ·Zbl 1136.91349号 ·doi:10.4310/CIS.2006.v6.n3.a5
[17]	J.-M.Lasry；P.-L.狮子，平均场游戏，Jpn。数学杂志。，2, 229-260 (2007) ·兹比尔1156.91321 ·doi:10.1007/s11537-007-0657-8
[18]	G.McLachlan和D.Peel，有限混合模型《Wiley Series in Probability and Statistics:Applied Probability and Statisticals》，Wiley-Interscience，纽约，2000年·Zbl 0963.62061号
[19]	MNIST手写数字数据库.，可从以下网址获得：http://yann.lecun.com/exdb/mnist/。
[20]	皮尔逊，对进化数学理论的贡献，哲学翻译。罗伊。社会学，185，71-110（1894）·JFM 25.0347.02号 ·doi:10.1098/rsta.1894.0003
[21]	S.Pequito、A.Pedro Aguiar、B.Sinopoli和D.A.Gomes，使用平均场游戏的有限混合模型的无监督学习，第49届Allerton通信、控制和计算年会，伊利诺伊州蒙蒂塞洛，2011年。
[22]	M.L.Puterman，关于受控扩散的政策迭代收敛性，J.Optim。理论应用。，33137-144（1981年）·Zbl 0421.93089号 ·doi:10.1007/BF00935182
[23]	M.L.Puterman；S.L.Brumelle，关于平稳动态规划中策略迭代的收敛性，数学。操作。决议，4，60-69（1979）·Zbl 0411.90072号 ·doi:10.1287/门4.1.60
[24]	M.E.Tarter和M.D.Lock，无模型曲线估计《统计学和应用概率专著》，56，查普曼和霍尔出版社，纽约，1993年·Zbl 0826.62025号
[25]	D.M.Titterington、A.F.M.Smith和U.E.Makov，有限混合分布的统计分析《威利级数概率与数理统计：应用概率与统计》，约翰·威利父子公司，奇切斯特，1985年·兹伯利0646.62013
[26]	M.Wedel和W.A.Kamakura，市场细分：概念和方法基础《定量营销国际系列》，第8期，斯普林格出版社，马萨诸塞州波士顿，2000年。

此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配，并且可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑非
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

伯努利分布和范畴分布有限混合的平均场博弈模型。（英语） Zbl 1473.62208号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

伯努利分布和范畴分布有限混合的平均场博弈模型。 （英语） Zbl 1473.62208号

MSC公司：

关键词：

软件：

参考文献：

伯努利分布和范畴分布有限混合的平均场博弈模型。（英语） Zbl 1473.62208号