统计学及其接口

第10卷(2017年)

数字4

离散潜在树模型的谱学习方法

页:677 – 698

内政部:https://dx.doi.org/10.4310/SI.2017.v10.n4.a11

作者

王晓飞(中国吉林省长春市东北师范大学数学与统计学院教育部应用统计学重点实验室)

郭建华(教育部应用统计学重点实验室,东北师范大学数学与统计学院,吉林省长春市)

郝丽珠(中国吉林省长春市东北师范大学数理统计学院教育部应用统计学重点实验室)

Nevin L.Zhang(香港九龙香港科技大学计算机科学与工程系)

摘要

我们考虑离散潜在树模型的结构学习和参数估计问题。对于结构学习,我们引入了基于概率矩阵奇异值的变量间广义信息距离的概念,并用它建立了一种自底向上的结构恢复算法。该算法被证明是一致的。此外,给出了精确结构恢复的有限样本界。对于参数估计,当每个潜在变量都有两个状态时,我们提出了一种新的矩阵分解算法。与期望最大化(EM)算法不同,我们的算法可以避免陷入局部最优。此外,还证明了其一致性,并给出了参数估计的有限样本界。

在结构学习和参数估计方面,提供了实证结果来支持我们的理论结果。在实际数据的应用中,我们分析了长春市长热线数据,其中检测到了汉语单词的基本结构。我们证明了该方法对于发现层次结构和潜在信息是有效的。

关键词

潜在变量、参数估计、光谱距离、结构学习

2010年数学学科分类

初级62H05。次要62H12。

2017年5月30日出版