本页包括JAIR上发布的调查论文。所有调查文章都经过与常规研究文章相同的严格审查过程,并遵循相同的重要性、相关性、技术性和说明性标准。此目录中的每个条目都提供了指向单个文章及其附录(如果有)的链接:


以决策为中心的学习:基础、现状、基准和未来机会

贾扬塔·曼迪(Jayanta Mandi)、詹姆斯·科塔利(James Kotary)、塞恩·伯登(Senne Berden)、马克西姆·穆兰巴(Maxime Mulamba)、维克托·布卡雷(Victor Bucarey)、蒂亚斯·冈斯(Tias Guns)和费迪南多·菲奥雷
 

RL/LLM分类树:回顾强化学习与大型语言模型之间的协同作用

Moschoula Pternea、Prerna Singh、Abir Chakraborty、Yagna Oruganti、Mirco Milletari、Sayli Bapat、Kebei Jiang
 

语言模型即服务:新范式概述及其挑战

伊曼纽尔·拉马尔法(Emanuele La Malfa)、阿列克桑达尔·彼得罗夫(Aleksandar Petrov)、西蒙·弗里德(Simon Frieder
 

混合公平划分:一项调查

刘胜新、陆新航、铃木和托比·沃尔什
 

基于计算论证的聊天机器人:综述

费德里科·卡斯塔尼亚、纳丁·科基扬、伊莎贝尔·萨松、西蒙·帕森斯和伊丽莎白·斯科拉
 

条件独立图的恢复方法综述

Harsh Shrivastava和Urszula Chajewska
 

深度强化学习中的结构:综述和有待解决的问题

Aditya Mohan、Amy Zhang和Marius Lindauer
 

学会解决社会困境:一项调查

Shaheen Fatima、Nicholas R.Jennings、Michael Wooldridge
 

基于分解的多目标强化学习:分类与框架

Florian Felten、El-Ghazali Talbi和Grégoire Danoy
 

人在回路强化学习:关于需求、挑战和机遇的调查与定位

卡尔·奥尔格·雷茨拉夫(Carl Orge Retzlaff)、斯里吉塔·达斯(Srijita Das
 

视觉基础语言学习:语言游戏、数据集、任务和模型综述

亚历山德罗·苏格里亚(Alessandro Suglia)、伊奥安妮斯·康斯塔斯(Ioannis Konstas)和奥利弗·莱蒙(Oliver Lemon)
 

超越常规风险的学习标准调查

Matthew J.Holland和Kazuki Tanabe
 

深度图表示学习方法综述

Ijeoma Amuche Chikwendo、Zhang Xiaoling、Isaac Osei Agyemang、Isaac-Adjei-Mensah、Ukwuoma Chiagozim Chima和Chukwuebuka Joseph Ejiyi
 

摊销变分推断:系统综述

Ankush Ganguly、Sanjana Jain和Ukrit Watchareueretai
 

如何DP-fy ML:具有差异隐私的机器学习实用指南

Natalia Ponomareva、Hussein Hazimeh、Alex Kurakin、Zheng Xu、Carson Denison、H.Brendan McMahan、Sergei Vassilvitskii、Steve Chien、Abhradep Guha Thakurta
 

配对游戏的复杂性:一项调查

马顿·贝内德克(Marton Benedek)、彼得·比罗(Peter Biro)、马修·约翰逊(Matthew Johnson)、丹尼尔·保卢斯马(Daniel Paulusma)和辛叶(Xin Ye)
 

走向绿色自动化机器学习:现状与未来方向

Tanja Tornede、Alexander Torned、Jonas Hanselle、Felix Mohr、Marcel Wever和Eyke Hüllermier
 

修复开裂的地基:生成文本评估实践障碍调查

塞巴斯蒂安·盖尔曼、伊丽莎白·克拉克和蒂鲍特·塞勒姆
 

影响稀疏奖励领域深度强化学习的环境特征概述

吉姆·马丁·卡塔科拉·奥卡纳(Jim Martin Catacora Ocana)、罗伯托·卡波比安科(Roberto Capobianco)和丹尼尔·纳尔迪(Daniele Nardi)
 

审稿人分配问题:文献综述

梅尔特姆·阿克索伊(Meltem Aksoy)、塞达·亚尼克(Seda Yanik)和穆罕默德·法提赫·阿马塞利(Mehmet Fatih Amasyali)
 

深度强化学习中的零炮概括研究综述

Robert Kirk、Amy Zhang、Edward Grefenstette和Tim Rocktäschel
 

互联网中对隐私要求的理解与表达

吉迪恩·奥古尼耶和纳丁·科奇扬
 

走向持续强化学习:回顾与展望

Khimya Khetarpal、Matthew Riemer、Irina Rish和Doina Precup
 

人工智能代理中的创造性问题解决:综述和框架

伊万娜·吉兹、拉克希米·奈尔、索尼娅·切尔诺娃和吉夫科·辛纳波夫
 

算法自动配置方法综述

Elias Schede、Jasmin Brandt、Alexander Tornede、Marcel Wever、Viktor Bengs、Eyke Hüllermier、Kevin Tierney
 

基于sEMG的上肢运动分类器:当前场景和未来挑战

毛里西奥·卡利亚里·托辛、朱利亚诺·科斯塔·马查多和亚历山大·巴尔比诺
 

跨越会话鸿沟:面向任务的多语言对话系统自然语言处理入门

Evgenia Razumovskaia、Goran Glavas、Olga Majewska、Edoardo M.Ponti、Anna Korhonen和Ivan Vulic
 

具有内在动机目标条件强化学习的自主智能体:一项简短调查

Cédric Colas、Tristan Karch、Olivier Sigaud和Pierre-Yves Oudeyer
 

学习声明行为模型的综合框架

迭戈·艾内托(Diego Aineto)、塞尔吉奥·吉梅内斯(Sergio Jiménez)和伊娃·奥奈迪亚(Eva Onaindia)
 

30岁时的归纳逻辑编程:新导论

安德鲁·克罗珀和塞巴斯蒂安·杜曼奇奇
 

自动强化学习(AutoRL):调查与开放问题

Jack Parker-Holder、Raghu Rajan、Xingyou Song、AndréBiedenkapp、Yingjie Miao、Theresa Eimer、Baohe Zhang、Vu Nguyen、Roberto Calandra、Aleksandra Faust、Frank Hutter和Marius Lindauer
 

具体愿景语言规划的核心挑战

乔纳森·弗朗西斯(Jonathan Francis)、北村奈良(Nariaki Kitamura)、费利克斯·拉贝尔(Felix Labele)、陆小鹏(Xiaopeng Lu)、英格丽德·纳瓦罗(Ingrid Navarro)和让·奥
 

神经自然语言生成:多语言、多模态、可控性和学习研究综述

Erkut Erdem、Menekse Kuyu、Semih Yagcioglu、Anette Frank、Letitia Parcalabescu、Barbara Plank、Andrii Babii、Oleksii Turuta、Aykut Erden、Iacer Calixto、Elena Lloret、Elena-Simona Apostol、Ciprian-Octavian Truic、BranislavaŠandrih、Sanda Martinć-Ipšić、Gábor Berend、Albert Gatt和Grázina Korvel
 

时间序列因果发现方法综述与评价

Charles K.Assaad、Emilie Devijver和Eric Gaussier
 

可解释的深度学习:针对未启蒙者的现场指南

Gabrielle Ras、Ning Xie、Marcel van Gerven和Derek Doran
 

对手领域对手建模综述

萨默·纳希德和什洛莫·齐尔伯斯坦
 

从分歧中学习:一项调查

亚历山德拉·N·乌马、托马索·福纳西亚里、德克·霍维、西尔维·鲍恩、芭芭拉·普朗克和马西莫·波西奥
 

人工智能中的量子数学

Dominic Widdows、Kirsty Kitto和Trevor Cohen
 

图形内核:综述

Giannis Nikolentzos、Giannis Siglidis和Michalis Vazirgiannis
 

十二种时间序列异常检测算法的实验比较与综述

辛西娅·弗里曼、乔纳森·梅里曼、伊恩·比弗和阿卜杜拉·穆恩
 

网络物理系统黑盒安全验证算法综述

Anthony Corso、Robert J.Moss、Mark Koren、Ritchie Lee和Mykel J.Kochenderfer
 

超维计算的理论透视

Anthony Thomas、Sanjoy Dasgupta和Tajana Rosing
 

视觉和语言研究的整合趋势:任务、数据集和方法综述

Aditya Mogadala、Marimuthu Kalimuthu和Dietrich Klakow
 

机器学习中的序列设置方法:综述

马特乌斯·朱雷维茨和莱昂·德钦斯基
 

面对网络上的滥用语言:一项基于伦理和人权视角的调查

斯维特兰娜·基里琴科(Svetlana Kiritchenko)、伊萨尔·内贾戈利(Isar Nejadgholi)和凯瑟琳·弗雷泽(Kathleen C.Fraser)

游戏计划:人工智能可以为足球做什么,足球可以为人工智能做什么

卡尔·图尔斯(Karl Tuyls)、沙耶根·奥米德沙维埃(Shayegan Omidshafeei)、保罗·穆勒(Paul Muller)、王哲(Zhe Wang)、杰罗姆·康纳(Jerome Connor)、丹尼尔·海恩斯(Daniel Hennes)、伊恩·格雷厄姆(Ian Graham)、威廉·斯皮尔曼(William Spearman)、蒂姆·沃斯科特(Tim Waskett)、达菲德钢铁公司(Dafydd Steel)、波琳·吕克(Pauline Luc)、阿德里亚德里亚·雷卡森斯(Ad,朱利安·佩罗拉(Julien Pérolat)、巴特·德·维尔德(Bart De Vylder)、S.M.阿里·埃斯拉米(S.M.Ali Eslami

约束多Agent Markov决策过程:问题和算法分类

弗里特斯·德尼尔斯(Frits de Nijs)、埃尔文·瓦勒文(Erwin Walraven)、马蒂杰斯·德维尔德(Mathijs M.de Weerdt)和马蒂杰斯·T·J·斯潘(Matthijs T.J.Spaan)

分类器链:回顾与展望

杰西·里德(Jesse Read)、伯恩哈德·普法林格(Bernhard Pfahringer)、杰弗里·霍姆斯(Geoffrey Holmes)和艾比·弗兰克(Eibe Frank)

自动化机器学习框架的基准和综述

马克·安德雷·泽勒和马可·胡贝尔

监督机器学习的可解释性研究综述

纳迪娅·伯卡特(Nadia Burkart)和马可·胡贝尔(Marco F.Huber)

深度强化学习:最新演练

亚里士多德·拉扎里迪斯(Aristitelis Lazaridis)、面部Anestis Fachantidis和伊奥安尼斯·弗拉哈瓦斯(Ioannis Vlahavas)

通过内在报酬调整行为:一项调查与实证研究

Cam Linke、Nadia M.Ady、Martha White、Thomas Degres和Adam White

审查自动编码器的缺失数据插补:技术趋势、应用和结果

里卡多·卡多索·佩雷拉(Ricardo Cardoso Pereira)、米里亚姆·塞奥安·桑托斯(Miriam Seoane Santos)、佩德罗·佩雷拉·罗德里格斯(Pedro Pereira Rodrigues)和佩德罗·恩里克·阿布雷乌(Pedro-Henriques Abreu)

针对新冠肺炎绘制人工智能应用前景图

约瑟夫·布洛克(Joseph Bullock)、亚历山德拉·卢奇奥尼(Alexandra Luccioni)、凯瑟琳·霍夫曼(Katherine Hoffman Pham)、辛西娅·辛·恩加·林(Cynthia Sin Nga Lam)和米格尔·朗戈·奥罗兹

神经机器翻译:综述

费利克斯·斯塔尔伯格

基于时间推理的文本时间信息提取研究综述

阿尔图尔·吕文伯格和玛丽·弗朗西娜·莫恩斯

文本中的自动语言识别研究综述

托米·萨卡里·绍希安、马可·路易斯、马科斯·赞佩里、蒂莫西·鲍德温和克里斯特·林登

跨语言单词嵌入模型综述

塞巴斯蒂安·鲁德、伊万·武利奇和安德斯·索加德

多智能体强化学习系统的迁移学习研究综述

菲利佩·莱诺·达·席尔瓦和安娜·海伦娜·雷亚·科斯塔

概率推理的状态空间抽象:系统综述

斯特凡·吕特克、马克斯·施罗德、弗兰克·克鲁格、塞巴斯蒂安·巴德和托马斯·柯斯特

从词到意义的嵌入:意义的向量表征综述

Jose Camacho-Collados和Mohammad Taher Pilehvar

混合贝叶斯网络推理算法综述

安东尼奥·萨尔梅隆、拉斐尔·拉米、海尔赫·兰塞斯、托马斯·尼尔森和安德斯·马德森

分布式约束优化问题及其应用综述

费迪南多·菲奥雷托、恩里科·蓬泰利和威廉·杨

词汇简化研究综述

古斯塔沃·帕特佐德和露西娅·斯佩西亚

拍卖中的无政府价格

蒂姆·拉夫加登(Tim Roughgarden)、瓦西里斯·锡尔甘尼(Vasilis Syrgkanis)和伊娃·塔尔多斯(Eva Tardos)

定性约束推理的模型论观点

曼纽尔·博德斯基和彼得·琼森

从图像自动生成描述:模型、数据集和评估方法综述

拉斐拉·伯纳迪、鲁克·卡基奇、德斯蒙德·埃利奥特、艾库特·埃尔登、埃尔库特·埃尔登、纳兹利·伊基兹勒·辛比斯、弗兰克·凯勒、阿德里安·马斯喀特和芭芭拉·普朗克

多智能体学习的进化动力学研究综述

Daan Bloembergen、Karl Tuyls、Daniel Hennes和Michael Kaisers

多目标序贯决策综述

D.M.Roijers、P.Vamplew、S.Whiteson和R.Dazeley

潜在树模型及其应用综述

R.Mourad、C.Sinoquet、N.L.Zhang、T.Liu、P.Leray

用于统计关系学习的图形数据转换

R.A.Rossi、L.K.McDowell和D.W.Aha、J.Neville

强化学习:一项调查

L.P.Kaelbling、M.L.Littman、A.W.Moore