×

统计分类器的域自适应。 (英语) Zbl 1161.68724号

总结:统计学习理论中使用的最基本假设是,训练数据和测试数据来自相同的基本分布。不幸的是,在许多应用程序中,“域内”测试数据来自与训练数据的“域外”分布相关但不相同的分布。我们考虑的常见情况是,标记的域外数据非常丰富,但标记的域内数据很少。我们根据一个简单的混合模型介绍了这个问题的统计公式,并将该框架实例化为最大熵分类器及其线性链对应物。针对这种特殊情况,我们提出了基于条件期望最大化技术的高效推理算法。我们的实验结果表明,在自然语言处理领域的四个不同数据集上,我们的方法在三个真实世界任务上的性能得到了改进。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司