年度IJCAI-JAIR最佳论文奖授予JAIR在过去五个日历年发表的杰出论文。奖项委员会由副编辑和JAIR咨询委员会成员组成;他们的决定是基于论文的重要性和演讲的质量。获奖者将获得500美元的奖金(由合著论文的作者分享)。该奖项由国际人工智能联合会议提供资金。


奖励机器:在强化学习中开发奖励功能结构

2023年奖
罗德里戈·托罗·伊卡特(Rodrigo Toro Icarte)、托林·克拉森(Toryn Q.Klassen)、理查德·瓦伦扎诺(Richard Valenzano)和希拉·麦克莱思(Sheila A.McIlraith)
引用:这项工作考虑了如何利用明确描述的奖励函数的结构来支持有效的学习。到目前为止,这一重要背景尚未被充分发掘;奖励函数通常是专家设计的,因此包含大多数现有工作忽略的结构。本文建议使用奖励机器来表示这种结构,奖励机器是一种具有丰富表现力的有限状态机;它还描述了几种强大而有效的方法来利用结果结构。这篇文章是一条有影响力的研究路线的高潮,该研究路线跨越并丰富了三个不同的社区:人工智能规划、强化学习和正式方法。
 

DESPOT:带正则化的在线POMDP规划

2022年奖
叶楠(Nan Ye)、索马尼(Adhiraj Somani)、徐大卫(David Hsu)和李维新(Wee Sun Lee)
引用:本文介绍了在线POMDP规划的最新成果。它提供了理论证明和实证评估,以证明作者提出的主张。在线POMDP求解是近年来比较流行的问题之一,而DESPOT被认为是这方面的首选之一。自发表以来,该论文一直用于解决应用中的问题,包括人机协作任务和自动驾驶,以及混合POMDP的基础研究。
 

从噪声数据中学习解释性规则

2021年度大奖
理查德·埃文斯和爱德华·格雷芬斯特特
引用:本文对人工智能做出了重要贡献,即归纳逻辑编程(ILP)的首批端到端可微方法之一。所采用的方法很优雅,将ILP完美地扩展到可微分域,为逻辑学习和深度(神经)学习之间的桥梁铺平了道路。自发表以来,这项工作激发了许多后续工作,其中所描述的思想,即通过定冠词的前向链接进行可微演绎,已被证明对使符号系统更健壮和神经系统更容易理解产生了深远影响。此外,本文对神经符号人工智能给予了新的强调和推动,进而对心理学、认知科学和人工智能中的系统1和系统2争论给予了新强调和推动。
 

从技能到符号:学习抽象高级规划的符号表示

2020年奖
乔治·科尼达利斯(George Konidaris)、莱斯利·帕克·凯尔布林(Leslie Pack Kaelbling)和托马斯·洛扎诺·佩雷斯(Tomas Lozano Perez)
引用:本文优雅地展示了如何自动构建适用于在连续的低级环境中评估由高级操作序列组成的计划的抽象表示。这遵循了人工智能中围绕过程抽象构建代理控制体系结构的悠久传统,即基于抽象符号表示,在高级动作和抽象表示之间建立原则联系,为构造具有可证明属性的抽象表示提供理论基础,并为自主学习抽象高级表示提供实用机制。
 

协同学习

2020荣誉奖
Pannaga Shivaswamy和Thorsten Joachims
引用:本文介绍了一种新的学习范式,它介于传统在线学习和强盗设置之间,前者算法可以看到每个操作的效用,后者只观察到最佳操作的效用。它给出了非常可靠的理论结果,显示了预期后悔的上限,并对在真实场景中实现该方法的许多算法进行了广泛的实验评估。
 

SAT和QSAT的条款删除

2019年奖
Marijn Heule、Matti Järvisalo、Florian Lonsing、Martina Seidl和Armin Biere
引用:本文描述了作为SAT和QBF求解器的预处理和简化技术的一系列子句消除过程的基本和实际结果。自出版以来,其中所述的技术已被证明对最先进的SAT和QBF解算器的效率具有深远影响。这部作品很优雅,完美地延伸了一些公认的理论概念。此外,本文对预处理和内处理技术给予了新的强调和推动,这一强调超越了作者所涵盖的SAT和QBF这两个关键问题。
 

帧图像描述作为排名任务:数据、模型和评估指标

2018年奖
M.Hodosh、P.Young和J.Hockenmaier
引用:本文讨论了将图像与描述图像中所描述内容的自然语言句子相关联的问题。它特别考虑了将图像与从大型预定义图像描述库中提取的句子关联起来的任务,并引入了一个基于句子的图像描述和搜索的基准集合,该集合后来在社区中广泛使用。作者描述并彻底评估了几种图像描述算法,并证明了在没有域内检测器的情况下,仅捕获低层感知特性的图像特征可以发挥令人惊讶的作用。在他们的实证评估中,他们考虑了不同的衡量单个图像对质量的指标。自动计算的分数也会与详细的人类判断进行比较。
 
这项工作因其对计算机视觉和自然语言处理交叉点的一个有趣问题的彻底实证处理以及对该领域文学的持久影响而受到认可。它清楚地表明了精心设计的基准集和计算实验的价值。总的来说,本文为人工智能中的高质量和有影响力的实证工作提供了一个很好的例子。

多模态分布语义

2017年奖
E.Bruni、N.K.Tran、M.Baroni
引用:本文描述了一种使用基于文本和图像的分布信息构建单词表示的过程。这是对自然语言和视觉领域的一项基本和创新贡献。另一个关键贡献是数据集,该数据集已被广泛使用。这项工作因其在人工智能多个领域的影响而得到认可,包括NLP、Vision和机器学习,并因其在分布式语义模型中引入多模态视角以计算词义表示方面的开创性作用而得到认可。

COLIN:连续线性数字变化的规划

2017年度荣誉奖
A.J.Coles、A.I.Coles、M.Fox、D.Long
引用:本文将领域模型的经典规划与持续变化的推理相结合,这是一个在AI社区内具有高度相关性的挑战性主题,也适用于现实应用,包括能源管理、化学工程和机器人。它通过有效地将启发式搜索与外部数字推理器(如线性程序求解器)相结合,引入了一个具体的实例,展示了自那时以来成为时间混合规划主要方法的内容。这项工作因其在人工智能规划内外的影响以及在混合离散连续规划技术发展中的开创性作用而受到认可。

社会选择理论中不可能定理的自动搜索:对象的排序集

2016年奖
克里斯蒂安·盖斯特(Christian Geist)、乌尔·恩德里斯(Ulle Endriss)
引用:本文通过研究将对单个对象的偏好与对对象集的偏好联系起来的公理,使用自动定理证明技术,展示了计算社会选择中的核心人工智能结果。这些公理表示为多个一阶逻辑中的公式,然后将其映射为可接受的命题逻辑公式,并使用SAT解算器进行处理。本文的一个重要贡献是,结果表明,对于固定的域大小发现的不一致性可以扩展到更大的域,从而导致不可能性定理。使用这种方法,作者验证了一些已知定理,并发现了几个新的定理。总的来说,这项工作的贡献对于计算社会选择和一般人工智能来说是相当重要的;它们包括:(i)一种实用的定理搜索自动方法,(ii)一些著名定理的验证,以及(iii)社会选择中几个新的非平凡不可能性定理的自动发现。

智能电网中基于代理的大规模微存储的理论和实践基础

2016年度荣誉奖
佩鲁克里什内·维特林古姆(Perukrishnen Vytelingum)、托马斯·沃斯(Thomas Voice)、萨瓦帕里·拉姆特尔(Sarvapali D.Rammour)、亚历克斯·罗杰斯(Alex Rogers)、尼古拉斯·R·詹宁斯

LAMA规划师:用地标指导基于成本的任何时间规划

2015年奖
S.Richter、M.Westphal
引用:本文对屡获殊荣的LAMA规划师进行了全面的描述和分析。介绍了LAMA结合成本敏感启发式算法对地标的使用,并通过详细而深入的实验研究评估和分析了规划师在不同配置下的性能。这篇写得很好的论文非常有影响力,有助于确立地标在经典规划中的关键技术。

基于Wikipedia的自然语言处理语义解释

2014年奖
谢尔·马尔科维奇(Shaul Markovitch),叶夫根尼·加布里洛维奇(Evgeniy Gabrilovich)
引用:本文展示了上下文词义如何在维基百科等百科全书知识库中衍生的高维概念空间中表示。一个关键的见解是,为语义分析任务提供的目标文档集通常不足;来自维基百科等公共资源的知识允许恢复上下文词义的细粒度表示,这可以显著提高文本分类质量和语义相关性评估。这项工作代表了对使用大规模百科全书资源提取意义表征的最早和最有影响力的调查之一,这一想法现在是自然语言处理和信息检索许多工作的核心。

Monte-Carlo AIXI逼近

2014年度荣誉奖
Joel Veness、Kee Siong Ng、Marcus Hutter、William Uther、David Silver
引用:本文研究了基于AIXI的直接近似设计强化学习代理的可能性,AIXI是不确定序列决策环境中最优性的贝叶斯概念。尽管AIXI是否能为设计学习代理提供实用基础尚不清楚,但本文通过利用蒙特卡罗树搜索和上下文树加权算法,首次证明了AIXI代理的合理实现。本文对部分可观测强化学习这一难题提出了大胆而新颖的观点,并在一系列应用中展示了令人印象深刻的结果。

自适应子模块:主动学习和随机优化的理论与应用

2013年奖
丹尼尔·戈洛文(Daniel Golovin)、安德烈亚斯·克劳斯(Andreas Krause)

SATzilla:SAT的基于投资组合的算法选择

2010年奖
L.Xu、F.Hutter、H.Hoos、K.Leyton-Brown

快速向下规划系统

2009年度荣誉奖
M.赫尔默特

纯纳什均衡:硬与易博弈

2008年奖
G.Gottlob、G.Greco、F.Scarcello

理解和利用小句学习的潜力

2008年度荣誉奖
P.Beame、H.Kautz、A.Sabharwal

分解MDP的高效求解算法

2007年奖
Guestrin,C.、Koller,D.、Parr,R.、Venkataraman,S。

加法模式数据库启发式

2007年度荣誉奖
费尔纳,A.,科尔夫,R.E.,哈南,S。

知识汇编图

2006年奖
A.Darwiche,P.侯爵。

概率规划的计算复杂性

2003年荣誉奖
Littman,M.L.、Goldsmith,J.、Mundhenk M。