多姆,H.III;D.马库。 统计分类器的域自适应。 (英语) Zbl 1161.68724号 J.阿蒂夫。智力。研究(JAIR) 26, 101-126 (2006). 总结:统计学习理论中使用的最基本假设是,训练数据和测试数据来自相同的基本分布。不幸的是,在许多应用程序中,“域内”测试数据来自与训练数据的“域外”分布相关但不相同的分布。我们考虑的常见情况是,标记的域外数据非常丰富,但标记的域内数据很少。我们根据一个简单的混合模型介绍了这个问题的统计公式,并将该框架实例化为最大熵分类器及其线性链对应物。针对这种特殊情况,我们提出了基于条件期望最大化技术的高效推理算法。我们的实验结果表明,在自然语言处理领域的四个不同数据集上,我们的方法在三个真实世界任务上的性能得到了改进。 引用于17文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 PDF格式BibTeX公司 XML格式引用 \textit{H.Daume III}和\textit{D.Marcu},J.Artif。智力。研究(JAIR)26,101-126(2006;Zbl 1161.68724) 全文: arXiv公司