×

噪声或成分分析及其在链路分析中的应用。 (英语) Zbl 1222.62066号

摘要:我们开发了一个新的组件分析框架,即Noisy-Or组件分析器(NOCA),它针对高维二进制数据。NOCA是一种概率潜在变量模型,它假设观测到的高维二进制数据的表达是由少量通过噪声或单元组合的隐藏二进制源驱动的。成分分析程序相当于学习NOCA参数。由于NOCA学习问题的经典EM公式很难处理,我们发展了它的变分近似。我们在两个问题上测试NOCA框架:(1)合成图像分解问题和(2)数千个CiteSeer文档的共引数据分析问题。我们证明了新模型在这两个问题上的良好性能。此外,我们将该模型与两种基于混合的潜在因素模型进行了比较:概率潜在语义分析(PLSA)和潜在Dirichlet分配(LDA)。这些模型背后的不同假设导致他们在共引数据中发现不同类型的结构,从而说明了NOCA在建立我们对高维数据集的理解方面的好处。

理学硕士:

62H25个 因子分析和主要成分;对应分析
68T99型 人工智能
PDF格式BibTeX公司 XML格式引用
全文: 链接