佩德罗·多明戈斯;迈克尔·巴扎尼 简单贝叶斯分类器在零损失下的最优性。 (英语) Zbl 0892.68076号 机器。学习。 29,编号2-3,103-130(1997). 摘要:当属性独立于类时,简单贝叶斯分类器是最优的,但到目前为止,是否存在其他最优性的充分条件的问题还没有被探讨。实证结果表明,它在许多包含明确属性依赖的领域中表现出奇的好,这表明这个问题的答案可能是肯定的。本文表明,尽管贝叶斯分类器的概率估计只有在独立性假设成立的情况下才是二次损失下的最优,但即使在很大程度上违背了这一假设,分类器本身也可以在零损失(误分类率)下达到最优。贝叶斯分类器的二次损失最优性区域实际上是零最优区域的二阶无穷小分数。这意味着贝叶斯分类器的适用范围比以前认为的要大得多。例如,在本文中,它被证明是学习连词和析取的最佳方法,尽管它们违反了独立性假设。此外,人工领域的研究表明,在常见的训练集大小和属性数量方面,它通常会优于功能更强大的分类器,即使其偏差在先验上远不适合该领域。本文的结果还表明,检测属性依赖性不一定是扩展贝叶斯分类器的最佳方法,这一点也得到了实证验证。 引用于104文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 关键词:简单贝叶斯分类器 PDF格式BibTeX公司 XML格式引用 \textit{P.Domingos}和\textit{M.Pazzani},马赫。学习。29,编号2--3,103-130(1997;Zbl 0892.68076) 全文: 内政部