×

用于从标记和未标记数据中学习的PAC类型模型。 (英语) Zbl 1137.68520号

Auer,Peter(编辑)等人,《学习理论》。第18届学习理论年会,COLT 2005,意大利贝蒂诺罗,2005年6月27日至30日。诉讼程序。柏林:施普林格出版社(ISBN 3-540-26556-2/pbk)。计算机科学课堂讲稿3559。人工智能课堂讲稿,111-126(2005)。
摘要:在机器学习中,将未标记数据与标记数据结合使用的实践越来越引起人们的兴趣,并且已经开发了许多不同的方法。然而,这些方法所基于的假设往往非常不同,并且没有被标准理论模型所捕获。在本文中,我们描述了一个PAC类型的框架,该框架可用于对许多这些假设进行建模,并在此设置中分析了样本复杂性问题:即,为了学好知识,应该期望需要多少每种类型的数据,以及这些数据所依赖的基本量是什么。我们的模型可以被视为标准PAC模型的扩展,其中除了概念类(C)之外,还提出了一种我们认为目标概念应该与底层分布具有的兼容性。从这个角度来看,未标记的数据可能会很有帮助,因为它允许人们估计假设空间上的兼容性,并将搜索空间的大小减少到根据自己的假设,在分布方面是先验合理的。我们讨论了在此背景下出现的一些技术问题,并提供了一致收敛和基于(ε)覆盖的算法的样本复杂性边界。我们还考虑了算法问题,并针对一种特殊的协同训练情况给出了一种有效的算法。
关于整个系列,请参见[Zbl 1076.68003号].

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部