日志跟踪–IJCAI 2023

已接受论文列表

J5552型

奥斯特罗姆制度分析与发展框架的计算模型（扩展摘要）

Nieves Montes、Nardine Osman、Carles Sierra

[+]更多

[-]更少

奥斯特罗姆的制度分析与发展（IAD）框架是一个综合性的理论努力，旨在确定和概述决定任何社会互动结果的变量。受其启发，我们定义了动作情景语言（ASL），这是一种机器可读的逻辑语言，用于表示多智能体交互的组件，特别关注社区采用的规则。ASL由一个游戏引擎补充，该引擎将交互描述作为输入，并自动将其语义作为扩展形式游戏（EFG）的基础，可以使用标准的游戏理论解决方案概念轻松地对其进行分析。总的来说，我们的模型允许代理社区通过自动将规则配置与其激励的结果联系起来，对考虑采用的一组规则执行假设分析。

关键字列表

基于代理和多代理系统->MAS：规范系统
基于Agent和多Agent系统->MAS：Agent理论和模型
基于代理和多代理系统->MAS：基于代理的模拟和涌现
基于代理和多代理系统->MAS：协调与合作

第5586页

数据信息知识和策略（扩展摘要）

Junli Jiang、Pavel Naumov

[+]更多

[-]更少

本文提出了一种新的多智能体系统知识和策略推理方法。它强调数据而不是代理作为战略知识的来源。该方法将Armstrong从数据库理论中得到的功能依赖表达式、基于Baltag和van Benthem最近工作的数据信息知识模式和新提出的数据信息策略模式结合在一起。主要技术成果是一个健全完整的逻辑系统，它描述了这三个逻辑运算符之间的相互作用。

关键字列表

知识表示和推理->KRR：行动推理
知识表示和推理->KRR：关于知识和信念的推理

J5650型

基于Q-学习的物理人-机器人协作模型预测变阻抗控制（扩展摘要）

Loris Roveda、Andrea Testa、Asad Ali Shahid、Francesco Braghin、Dario Piga

[+]更多

[-]更少

在许多情况下，越来越需要物理人机协作。为了实现有效的协作，机器人应该能够识别人类的意图，并保证沿着预期的运动方向进行安全和自适应的行为。工业领域特别需要具有此类属性的机器人控制策略。事实上，为了实现这一目标，本研究提出了一种基于Q学习的模型预测变阻抗控制（Q-LMPVIC），以帮助操作员完成物理人机协作（pHRC）任务。设计了一个笛卡尔阻抗控制回路来实现解耦的柔顺机器人动力学。然后在线优化阻抗控制参数（即设定值和阻尼参数），以最大化pHRC的性能。为此，设计了一个神经网络集成来学习人机交互动力学建模，同时捕获相关的不确定性。然后由模型预测控制器（MPC）利用导出的模型，并通过Lyapunov约束增强稳定性保证。MPC通过使用Q-Learning方法来求解，该方法在其在线实现中使用actor-critic算法来近似精确解。事实上，Q-学习方法提供了一个准确高效的解决方案（在计算时间和资源方面）。以Franka EMIKA熊猫机器人为测试平台，通过实验验证了该方法的有效性。

关键字列表

机器人->ROB：人机交互
机器人->ROB：应用
机器人->ROB：行为和控制
机器人->ROB：机器人学习

J5685型

ISO 24617-2对话行为注释标准定义的通用通信功能的自动识别（扩展摘要）

尤热尼奥·里贝罗、里卡多·里贝洛、大卫·马丁斯·德马托斯

[+]更多

[-]更少

从对话系统的角度来看，识别对话片段背后的意图很重要，因为它提供了关于片段中存在的信息以及如何解释这些信息的线索。ISO 24617-2对话行为注释标准定义了一组层次结构的通用通信功能，这些功能对应于对话上下文中相关的不同意图。在本文中，我们探讨了这些函数的自动识别。为此，我们建议将现有的方法应用于对话行为识别，以便它们能够处理层次分类问题。更具体地说，我们建议使用具有级联输出和最大后验路径估计的端到端层次网络来预测层次结构每个级别的通信功能，保留路径中功能之间的依赖性，并决定在哪个级别停止。此外，我们依靠转移学习过程来解决数据稀缺问题。我们在DialogBank上的实验表明，该方法优于基于多分类器的平面和层次方法，并且其每个组件在识别通用交际功能中都起着重要作用。

关键字列表

自然语言处理->NLP：文本分类
自然语言处理->NLP：对话和交互系统

J5688

部分可观测多智能体决策的形式化模型再思考（扩展抽象）

沃伊特·奇·科瓦尼克、马丁·施密德、尼尔·伯奇、迈克尔·鲍林、维利亚姆·利斯

[+]更多

[-]更少

部分可观测环境下的多智能体决策通常被建模为博弈论中的扩展形式博弈（EFG）或多智能体强化学习（MARL）中的部分可观测随机博弈（POSG）。当前情况的一个问题是，虽然大多数实际问题都可以用两种形式建模，但这两种模型的关系并不明确，这阻碍了两个社区之间的思想交流。第二个问题是，虽然EFG最近在算法方面取得了重大进展，但其经典形式化不适合有效地表示底层思想，例如分解思想。为了解决第一个问题，我们引入了因子观测随机博弈（FOSG），这是对POSG形式主义的一个微小修改，它区分了私人观测和公共观测，从而大大简化了分解。为了解决第二个问题，我们表明FOSG和POSG与EFG是自然连接的：通过将FOSG“展开”为其树形式，我们可以获得EFG。相反，任何完全可重新调用的定时EFG都会以这种方式对应于一些潜在的FOSG。此外，这种关系证明了对经典EFG形式化的几项微小修改是合理的，后者最近作为对模型分解问题的隐式响应出现。最后，我们通过介绍FOSG框架中的三种关键EFG技术（反事实后悔最小化、序列形式和分解）来说明EFG和MARL之间的思想传递。

关键字列表

博弈论与经济范式->GTEP：非合作博弈
基于Agent和多Agent系统->MAS:Agent理论和模型
基于代理和多代理系统->MAS：多代理学习

J5758号

多代理顾问Q-Learning（扩展摘要）

Sriram Ganapathi Subramanian、Matthew E.Taylor、Kate Larson、Mark Crowley

[+]更多

[-]更少

在过去十年中，多智能体强化学习（MARL）取得了重大进展，但仍有许多挑战需要克服，例如高样本复杂度和稳定策略收敛速度慢，这些挑战需要在大规模部署之前加以克服。然而，实际上，许多现实环境已经部署了次优或启发式方法来生成策略。一个有趣的问题是如何最好地使用顾问等方法来帮助改进多智能体领域中的强化学习。我们提供了一个原则性框架，用于在多代理设置中合并来自在线次优顾问的行动建议。我们描述了在非约束广义和随机博弈环境中访问多智能增强代理（ADMIRAL）的问题，并提出了两种基于Q学习的新算法：ADMIRAL-DM和ADMIRAL-Advisor Evaluation，这使我们能够通过适当地吸收顾问（ADMIRAL-DM）的建议来改进学习，并评估顾问的有效性（ADMINAL-AE）。我们从理论上分析了这些算法，并为它们在一般和随机博弈中的学习提供了不动点保证。此外，大量实验表明，这些算法：可用于各种环境，性能优于其他相关基线，可扩展到大型状态操作空间，并且对顾问的不良建议具有鲁棒性。

关键字列表

基于代理和多代理系统->MAS：多代理学习
机器学习->ML：深度强化学习
机器学习->ML：强化学习

J5919号

乘用车搬迁优化代理的强化学习（扩展摘要）

袁恩鹏、陈文波、帕斯卡·范·亨特利克

[+]更多

[-]更少

闲置车辆迁移对于解决骑乘系统中经常出现的供需失衡至关重要。当前的主流方法——优化和强化学习——存在明显的计算缺陷。优化模型需要实时求解，通常需要权衡模型保真度（因此解决方案的质量）以提高计算效率。强化学习的培训成本很高，而且往往难以在大型车队之间实现协调。本文设计了一种混合方法，利用两者的优点，同时克服其缺点。具体而言，它训练优化代理，即近似优化模型的机器学习模型，并通过强化学习细化代理。这种从优化代理中强化学习（RLOP）方法可以有效地训练和部署，并且比单独的RL或优化获得更好的结果。在纽约数据集上的数值实验表明，与优化模型相比，RLOP方法显著降低了重新定位成本和计算时间，而由于计算复杂性，纯强化学习无法收敛。

关键字列表

机器学习->ML:应用程序
机器学习->ML：强化学习
计划和调度->PS：实时计划

J5920型

从袋子里出来！人工智能伦理教育的筒仓：全球人工智能课程的无监督主题建模分析（扩展摘要）

拉娜·塔拉尔·贾维德（Rana Tallal Javed）、奥萨马·纳西尔（Osama Nasir

[+]更多

[-]更少

本研究以潜在狄利克雷分配为分析工具，探讨了高等教育中人工智能伦理教学的主题和趋势。这些分析包括来自全球105所大学的166门课程。基于未发现的模式，我们提炼出一个当前教学实践的模型，即BAG模型（构建、评估和管理），该模型结合了认知水平、课程内容和学科。这项研究批判性地评估了这种教学模式的含义，并要求从业者反思他们的实践，超越陈规定型观念和偏见。

关键字列表

人工智能伦理、信任、公平->概述
数据挖掘->常规
数据挖掘->DM：探索性数据挖掘

J5921号

基于风险平均强化学习的均值半方差策略优化（扩展摘要）

马晓腾、马帅、李霞、赵千川

[+]更多

[-]更少

在现实决策环境中，如金融、机器人技术、自动驾驶等，控制风险通常比最大化预期回报更为关键。风险度量的最自然选择是方差，而方差会对上行波动和下行波动造成不利影响。相反，（下行）半方差（捕获随机变量在其均值下的负偏差）更适合于风险规避建议。本文旨在优化具有稳定报酬分布的强化学习中的均值-方差（MSV）准则。由于半方差是时间不一致的，并且不满足标准的Bellman方程，因此传统的动态规划方法不能直接应用于MSV问题。为了应对这一挑战，我们运用摄动分析（PA）理论，建立了MSV的性能差异公式。我们发现，MSV问题可以通过使用策略相关的奖励函数迭代求解一系列RL问题来解决。此外，我们基于策略梯度理论和信赖域方法提出了两种基于策略的算法。最后，我们在MuJoCo中进行了从简单盗贼问题到连续控制任务的各种实验，证明了我们提出的方法的有效性。

关键字列表

机器学习->ML：强化学习
机器学习->ML：深度强化学习
计划和调度->PS:Markov决策过程
AI->UAI中的不确定性：顺序决策

J5922号

人工智能代理中的创造性问题解决：综述和框架（扩展摘要）

Evana Gizzi、Lakshmi Nair、Sonia Chernova、Jivko Sinapov

[+]更多

[-]更少

创造性问题解决（CPS）是人工智能中的一个子领域，专注于解决自治系统中的非标称或异常问题的方法。尽管人工智能在规划和学习方面取得了许多进步，但解决新问题或将现有知识适应新环境，尤其是在环境可能以不可预测的方式发生变化的情况下，仍然是一项挑战。为了促进对CPS的进一步研究，我们提出了CPS的定义和框架，用于对该领域现有的人工智能方法进行分类。我们以开放的研究问题结束了调查，并提出了未来的方向。

关键字列表

知识表示与推理->KRR：学习与推理
人类与人工智能->HAI:认知系统
多学科主题与应用->MDA：艺术与创意
计划和调度->PS：计划算法
规划和调度->PS：机器人规划
机器人->ROB：认知机器人

J5923号

设计师的道德观——如何培养有道德的人工智能设计师（扩展摘要）

Loís Vanhée，Melania Borit

[+]更多

[-]更少

对人工智能技术的伦理关注引发了围绕其设计者接受伦理培训的讨论。道德行为培训设计师，被理解为在任何情况下习惯性地应用道德原则，可以在人工智能系统的研究、开发和应用实践中产生重大影响。基于计算机科学、道德心理学和教育学的跨学科知识和实践经验，我们提出了一种提供这种培训的实用方法。

关键字列表

多学科主题和应用->MDA：教育
AI道德、信任、公平->概述
AI道德、信任、公平->ETF：AI与法律、治理、监管
AI道德、信任、公平->ETF：道德、法律和社会问题
AI道德、信任、公平->ETF：道德决策
AI道德、信任、公平->ETF：AI的社会影响
AI道德、信任、公平->ETF：值得信赖的AI
AI道德、信任、公平->ETF：价值观
人类与AI->HAI：计算可持续性与人类福祉

J5924号

基于逻辑的经典和混合规划问题解释生成框架（扩展摘要）

Stylianos Loukas Vasileiou、William Yeoh、Son Tran、Ashwin Kumar、Michael Cashmore、Daniele Magazzeni

[+]更多

[-]更少

在有人感知的规划系统中，当计划看起来不可行或不太理想时，规划代理可能需要向人类用户解释其计划。有人提出了一种流行的方法，称为模型协调，以使人类用户的模型更接近代理的模型。本文从知识表示和推理的不同角度来处理模型协调问题，并证明我们的方法不仅适用于经典规划问题，也适用于具有持续动作和事件/过程的混合系统规划问题。

关键字列表

计划和调度->PS：基于模型的推理
人类与AI->HAI：人与AI合作
知识表示与推理->KRR：诊断与溯因推理
知识表示与推理->KRR：信念改变

J5925号

基于人类反馈的可解释局部概念解释预测全死因（扩展摘要）

拉德瓦·沙维（Radwa El Shawi）、穆阿兹·阿尔马拉（Mouaz Al-Mallah）

[+]更多

[-]更少

机器学习模型被纳入不同的领域和学科，其中一些需要高度的问责制和透明度，例如医疗保健部门。一种广泛使用的解释技术试图通过量化每个输入特征的重要性得分来解释模型的预测。然而，总结这些分数以提供人类可解释的解释是具有挑战性的。另一类解释技术侧重于学习高级人类可理解概念的领域表示，然后利用它们解释预测。这些解释因概念的构造方式而受阻，而这些概念在本质上是不可解释的。为此，我们提出了基于概念的带反馈的局部解释（CLEF），这是一种新的局部模型无关解释框架，用于学习高维表格数据中的一组高级透明概念定义，该数据使用临床医生标记的概念，而非原始特征。

关键字列表

AI道德、信任、公平->ETF：可解释性和可解释性
AI道德、信任、公平->ETF：值得信赖的AI
AI道德、信任、公平->ETF：道德、法律和社会问题
AI道德、信任、公平->概述

J5926号

部分可观测域中基于信念报酬的简化风险感知决策（扩展抽象）

安德烈·日特尼科夫（Andrey Zhitnikov），瓦迪姆·英德尔曼（Vadim Indelman）

[+]更多

[-]更少

减轻决策问题在部分可观测性下的计算负担是一个长期的目标。识别原始问题的各个组成部分对简化的敏感性具有巨大的影响。然而，不确定性下的决策算法通常依赖于近似或启发式，而没有量化其效果。因此，具有挑战性的场景可能会严重影响此类方法的性能。在本文中，我们通过移除标准近似值并考虑所有先前抑制的随机变异源，将决策机制扩展到整体。在这个扩展的基础上，我们仔细检查了回报的分布。我们从给定单个候选策略的返回开始，继续到给定对应的一对候选策略的一对返回。此外，我们提出了新的收益随机界和新的工具，概率损失（PLoss）及其在线可访问的对应项（PbLoss），以表征简化的效果。

关键字列表

计划和调度->PS:POMDP
计划和调度->PS：不确定性下的计划
机器人->ROB：运动和路径规划
AI->UAI中的不确定性：顺序决策

J5927号

通过统计特征证明时间序列域鲁棒性的对抗框架（扩展摘要）

Taha Belkhouja、Janardhan Rao Doppa

[+]更多

[-]更少

时间序列数据出现在许多实际应用中（例如，移动健康），深度神经网络（DNN）在解决这些数据方面取得了巨大成功。尽管取得了成功，但人们对其对抗性攻击的鲁棒性知之甚少。在本文中，我们提出了一种新的对抗框架，称为基于统计特征的时间序列攻击（TSA-STAT）。为了应对时间序列领域的独特挑战，TSA-STAT利用对时间序列数据统计特征的约束来构造对抗性示例。优化的多项式变换用于创建比基于加性扰动的攻击更有效的攻击（就成功愚弄DNN而言）。我们还为构造对抗性示例提供了统计特征范数的认证界。我们在不同的真实世界基准数据集上的实验表明，TSA-STAT在时间序列域欺骗DNN和提高其鲁棒性方面是有效的。

关键字列表

机器学习->ML：时间序列和数据流
机器学习->ML：健壮性

J5928号

SAMBA：安全联盟多武装匪徒的通用框架（扩展抽象）

Radu Ciucanu、Pascal Lafourcade、Gael Marcadet、Marta Soare

[+]更多

[-]更少

我们解决了跨竖井联合学习环境中多武装盗贼的安全累积回报最大化问题。在中央服务器的协调下，参与累积奖励计算的每个数据所有者都保证其原始数据不会被其他参与者看到。我们依赖于加密方案并提出SAMBA，这是一个用于安全federAted多臂BAndits的通用框架。我们表明，SAMBA返回的累积回报与土匪算法的非安全版本相同，同时满足正式证明的安全属性。我们还表明，加密原语导致的开销在输入大小上是线性的，这一点通过我们的实现得到了证实。

关键字列表

多学科主题和应用->MDA：安全和隐私
机器学习->ML：联合学习
AI->UAI中的不确定性：顺序决策

J5930型

基于混合搜索的复杂智能体和环境下不确定性运动规划（扩展抽象）

丹尼尔·斯特劳斯、布莱恩·威廉姆斯

[+]更多

[-]更少

当自治系统处理更多的现实情况时，任务的成功往往无法保证，规划师必须对失败的概率进行推理。不幸的是，由于需要考虑复杂的多维概率分布，计算满足任务目标的轨迹，同时限制故障概率是很困难的。最近的方法成功地使用了基于机会约束的模型规划。我们认为这些方法有两个主要缺点。首先，目前的方法无法处理表达性环境模型，例如3D非凸障碍物。其次，大多数规划师在计算轨迹风险时都依赖于大量的简化，包括近似代理的动力学、几何和不确定性。我们将混合搜索应用于有风险、目标导向的规划问题。混合搜索由区域规划器和轨迹规划器组成。区域规划师通过推理代理为了完成任务应该访问的几何区域来进行离散选择。在制定区域规划器时，我们提出了有助于生成无障碍路径的地标区域。区域规划器将路径通过环境传递给轨迹规划器；轨迹规划器的任务是优化轨迹，以尊重代理的动态和用户期望的任务失败风险。我们讨论了三种轨迹风险建模方法：基于CDF的方法、基于抽样的配置方法和名为射法蒙特卡罗的算法。全文中给出了各种2D和3D测试用例，包括线性用例、Dubins汽车模型和水下自主飞行器。该方法在求解速度和实用性方面优于其他方法。此外，仿真结果表明，弹道风险模型能够更好地逼近风险。

关键字列表

计划和调度->PS：不确定性下的计划
规划和调度->PS：机器人规划
机器人->ROB：运动和路径规划

J5931号

具体愿景语言规划的核心挑战（扩展摘要）

乔纳森·弗朗西斯（Jonathan Francis）、北村奈良（Nariaki Kitamura）、费利克斯·拉贝尔（Felix Labele

[+]更多

[-]更少

多模态机器学习和人工智能（AI）领域的最新进展导致在计算机视觉、自然语言处理和机器人学的交叉点开发具有挑战性的任务。尽管许多方法和以往的调查研究都描述了其中一个或两个维度，但尚未对这三个维度进行整体分析。此外，即使考虑这些主题的组合，也会更多地关注描述，例如当前的体系结构方法，而不是说明该领域的高层次挑战和机遇。在这篇调查论文中，我们讨论了嵌入式视觉语言规划（EVLP）任务，这是一系列突出的嵌入式导航和操作问题，它们共同利用计算机视觉和自然语言在物理环境中进行交互。我们提出了一种分类法来统一这些任务，并对用于EVLP任务的新算法方法、度量、模拟器和数据集进行了深入的分析和比较。最后，我们提出了我们认为新的EVLP工作应该解决的核心挑战，并且我们提倡任务构建，以实现模型的通用性并促进实际部署。

关键字列表

机器人->概述
自然语言处理->NLP：应用
计划和调度->PS：应用程序
机器人->ROB：机器人学习

J5933号

企业对企业会议调度问题的约束求解方法（扩展摘要）

Miquel Bofill、Jordi Coll、Marc Garcia、Jesüs Giráldez-Cru、Gilles Pesant、Josep Suy、Mateu Villaret

[+]更多

[-]更少

B2B会议日程安排优化问题（B2BSP）包括在给定的两对参与者之间安排一组会议，以最小化参与者日程安排中的空闲时间段，同时考虑参与者的可用性和住宿能力。因此，在许多现实世界的B2B事件中，它构成了一个具有挑战性的组合问题。本文对解决这一问题的几种方法进行了比较研究。它们基于约束规划（CP）、混合整数规划（MIP）和最大可满足性（MaxSAT）。CP方法依赖于使用全局约束，并已在MiniZin中实现，以便能够在此设置中比较CP、Lazy子句生成和MIP作为解决技术。还提出了一种纯MIP编码。最后，在MaxSAT下考虑了另一种观点，显示了在考虑某些隐含约束时的最佳性能。在真实B2B实例和特制实例上的实验结果表明，MaxSAT方法是解决此问题的最佳方法，具有更好的解决时间，有时甚至比CP和MIP小几个数量级。

关键字列表

约束满足和优化->CSO：应用
约束满足和优化->CSO：约束编程
约束满足和优化->CSO：建模

J5934号

Max-SAT的证明和证书（扩展摘要）

马蒂厄·派、穆罕默德·萨米·谢里夫、贾马尔·哈贝特

[+]更多

[-]更少

在本文中，我们提出了一个名为MS-Builder的工具，该工具以等价-保留转换序列的特定形式为Max-SAT问题生成证书。为了生成证书，MS-Builder迭代调用SAT预言机以获得SAT解析反驳，该反驳被处理并改编为Max-SAT的合理反驳。特别是，如果计算出的Max-SAT反驳是半读的、树状规则的，则其大小与初始反驳的大小成线性关系，树状或半树状。此外，我们提出了一个可扩展的工具，称为MS-Checker，能够使用Max-SAT推理规则验证任何Max-SAT证书的有效性。

关键字列表

约束满足与优化->CSO：可满足性
约束满足和优化->CSO：解算器和工具

J5935型

基于内存有限模型的诊断（扩展抽象）

帕特里克·罗德勒

[+]更多

[-]更少

基于模型的诊断是一种原则性的、广泛适用的基于人工智能的方法，用于解决包括软件、知识库、电路、汽车和机器人在内的广泛领域中的调试问题。每当需要以给定的优先顺序（例如基数或概率）对故障解释进行合理和完整的计算时，所有现有的诊断算法都会受到指数空间复杂性的影响。这可能会阻止它们在内存受限的设备上以及在内存密集型问题情况下应用。作为一种补救措施，我们提出了RBF-HS，这是一种基于Korf开创性的RBFS算法的诊断搜索，它可以在线性空间边界内以最佳一阶枚举任意固定数量的故障解释，而不会牺牲其他理想的性质。对实际诊断案例的评估表明，RBF-HS在用于计算最小基数故障解释时，在大多数情况下节省了大量空间，而与Reiter的HS-Tree（具有相同属性的最具影响力的诊断算法之一）相比，所需的时间甚至更长。

关键字列表

知识表示与推理->KRR：诊断与溯因推理
知识表示与推理->KRR：应用
知识表示与推理->KRR：自动推理与定理证明
知识表示与推理->KRR：语义Web
搜索->S:应用程序
搜索->S：组合搜索和优化
搜索->S：启发式搜索
AI->UAI中的不确定性：顺序决策

J5936号

预训练语言模型的无监督和少量快照解析（扩展抽象）

曾志远、熊德义

[+]更多

[-]更少

本文提出了两种无监督成分分析模型（UPOA和UPIO），它们仅基于预处理语言模型中学习的自关注权重矩阵计算内部和外部关联分数。将提出的无监督解析模型进一步扩展到少数快照解析模型（FPOA，FPIO），这些模型使用一些带注释的树来微调自关注中的线性投影矩阵。在PTB和SPRML上的实验表明，无监督和少量快照解析方法都优于或可与以前的方法相比。

关键字列表

自然语言处理->NLP：标记、分块和解析
自然语言处理->常规

J5937号

多智能体系统中条件范数的数据驱动修正（扩展摘要）

达维德·德尔安纳、娜塔莎·阿莱奇纳、法比亚诺·达尔皮亚斯、梅赫迪·达斯塔尼、布赖恩·洛根

[+]更多

[-]更少

在多智能体系统中，规范执行是一种引导单个智能体行为以实现所需的系统级目标的机制。然而，由于多智能体系统的动态性，很难设计出保证在每个操作环境中实现目标的规范。此外，这些目标可能会随着时间而改变，从而使先前定义的规范无效。在本文中，我们研究了如何使用系统执行数据自动合成和修改有截止日期的条件禁止，这是一种旨在防止代理表现出特定行为模式的规范。我们提出了DDNR（数据驱动规范修订），这是一种数据驱动的规范修订方法，它综合了关于描述系统中代理行为的跟踪数据集的修订规范。我们使用最先进的现成城市交通模拟器评估DDNR。结果表明，DDNR综合了修订后的规范，这些规范在区分实现系统级目标的适当和不适当行为方面比原始规范更为准确。

关键字列表

基于代理和多代理系统->MAS：规范系统
基于代理和多代理系统->MAS：基于代理的模拟和涌现
基于代理和多代理系统->MAS：协调与合作
基于代理和多代理系统->MAS：工程方法、平台、语言和工具
基于代理和多代理系统->MAS：形式验证、验证和合成
知识表示与推理->KRR：学习与推理
机器学习->ML:分类

J5938型

时间序列因果发现方法综述与评价（扩展摘要）

Charles K.Assaad、Emilie Devijver、Eric Gaussier

[+]更多

[-]更少

在本次调查中，我们介绍了迄今为止提出的主要概念、模型和算法，以从观测时间序列推断因果关系，这项任务通常称为时间序列中的因果发现。为此，在描述了基本概念和建模假设之后，我们根据它们所属的方法系列提出了不同的方法：格兰杰因果关系法、基于约束的方法、基于噪声的方法、计分方法、基于逻辑的方法、拓扑方法和基于差异的方法。然后，我们评估了几种具有代表性的方法，以说明不同方法族的行为。这幅图是在具有不同特征的人工数据集和真实数据集上进行的。从这项调查中可以得出的主要结论是，时间序列中的因果发现是一个活跃的研究领域，在这个领域中，新方法（在每个方法家族中）都会定期提出，并且没有一个家族或方法在所有情况下都能脱颖而出。事实上，它们都依赖于对特定数据集可能适用或不适用的假设。

关键字列表

AI->UAI中的不确定性：因果关系、结构因果模型和因果推理
机器学习->ML：时间序列和数据流

J5939号

自动算法配置方法综述（扩展摘要）

Elias Schede、Jasmin Brandt、Alexander Tornede、Marcel Wever、Viktor Bengs、Eyke Hüllermier、Kevin Tierney

[+]更多

[-]更少

算法配置（AC）涉及参数化算法的最合适的参数配置的自动搜索。目前，文献中提出了多种AC问题变体和方法。现有的审查没有考虑到AC问题的所有衍生工具，也没有提供完整的分类方案。为此，我们引入分类法来分别描述AC问题和配置方法的特性。现有的AC文献根据所提供的分类法进行分类和表征。

关键字列表

搜索->S：算法组合和配置

J5940型

用于运行时推理的增量事件演算（扩展抽象）

Efthimis Tsilionis、Alexander Artikis、Georgios Paliouras

[+]更多

[-]更少

我们提出了一个用于在线增量复合事件识别的系统。在流媒体环境中，通常情况下，数据到达时会有来自底层源的（可变）延迟，并且会被底层源修改。我们提出了RTEC_inc，这是RTEC的一个增量版本，是一个具有正式声明语义的复合事件识别引擎，已经证明可以扩展到多个实际数据流。RTEC通过从头计算所有查询来处理事件的延迟到达和修订。这通常效率低下，因为它会导致冗余计算。相反，RTEC_inc通过仅更新受影响的查询，以更有效的方式处理延迟和修订。我们使用真实数据集和合成数据集对RTEC_inc和RTEC进行了实验比较。结果与我们的复杂性分析一致，并表明RTEC_inc在许多实际情况下都优于RTEC。

关键字列表

知识表示和推理->概述
知识表示与推理->KRR：逻辑编程
知识表示与推理->KRR：非单调推理
知识表示和推理->KRR：行动推理
知识表示和推理->KRR：关于知识和信念的推理

J5941号

货物的有序最大份额近似（扩展摘要）

哈迪·侯赛尼、安德鲁·肖恩斯、埃雷尔·塞加尔·哈列维

[+]更多

[-]更少

在不可分割货物的公平划分中，d中的l最大份额（MMS）是代理人可以通过将货物划分为d个捆绑包并选择l个最不优选的捆绑包来保证的价值。大多数现有的工作旨在向所有代理保证其n选1 MMS的恒定部分。但这种保证对代理人基本估价中的小扰动很敏感。我们考虑了一个更稳健的近似概念，它只依赖于代理的捆绑顺序排名。我们证明了对于任何大于或等于1的整数l，商品的l-out-of-floor（（l+1/2）n）MMS分配的存在性，并给出了一个多项式时间算法，该算法在l=1时找到了1-out-of-celing（3n/2）MMS的分配。我们进一步开发了一种算法，该算法为任何l>1的MMS提供了较弱的序数近似。

关键字列表

博弈论与经济范式->GTEP：公平分工
博弈论和经济范式->GTEP：其他
AI道德、信任、公平->ETF：公平和多样性

J5942号

伪布尔约束与At-Most-One约束的SAT编码（扩展抽象）

米奎尔·博菲尔（Miquel Bofill）、乔迪·科尔（Jordi Coll）、彼得·南丁格尔（Peter Nightingale）、约塞普·苏伊（Josep Suy）、费利克斯·乌里奇·奥尔坦（Felix Ulrich-Oltean）、马图·维拉雷（Mateu Villaret）

[+]更多

[-]更少

在利用命题可满足性（SAT）求解组合问题时，约束的编码至关重要。伪布尔（PB）约束经常出现在各种各样的问题中。当PB约束与at-most-one（AMO）约束一起出现在相同变量上时，它们可以组合成PB（AMO）约束。在本文中，我们提出了新的PB（AMO）约束编码。我们的实验表明，这些编码可以大大小于PB约束的编码，并允许在一个时间限制内解决更多的实例。我们还观察到，在考虑的编码中没有一个整体胜利者，但每个编码的效率可能取决于PB（AMO）特性，例如系数值的大小。

关键字列表

约束满足与优化->CSO：可满足性
约束满足和优化->CSO：建模
约束满足和优化->CSO：约束满足

J5943号

关于处理决策树中的解释冗余（扩展抽象）

亚辛·伊扎（Yacine Izza）、阿列克谢·伊格纳提耶夫（Alexey Ignatiev）、若昂·马奎斯·西尔瓦（Joao Marques-Silva）

[+]更多

[-]更少

关于决策树可解释性的说法可以追溯到机器学习（ML）的起源。事实上，给定一些与决策树路径一致的输入，对结果预测的解释包括该路径中的特征。此外，越来越多的工作建议使用决策树和其他所谓的可解释模型，作为在高风险应用程序中部署ML模型的可能解决方案。本文概述了最近的理论和实践结果，这些结果表明，对于大多数决策树，树路径表现出所谓的解释冗余，因为逻辑上合理的解释通常比路径中的特征所指示的要简洁得多。更重要的是，这样的决策树解释可以在多项式时间内计算，因此，除了遍历决策树之外，基本上不需要任何努力就可以生成。在大量公开可用的决策树上获得的实验结果支持了论文的观点。

关键字列表

机器学习->ML：可解释/可解释的机器学习
AI道德、信任、公平->ETF：值得信赖的AI
约束满足和优化->CSO：约束满足
约束满足与优化->CSO：可满足性
知识表示与推理->KRR：自动推理与定理证明
知识表示与推理->KRR：诊断与溯因推理
机器学习->ML：符号方法

第5944页

错误的安全感（扩展摘要）

皮耶罗·A·博纳蒂

[+]更多

[-]更少

越来越多的关于知识表示和推理保密性的文献有时可能会导致错误的安全感，因为缺乏关于攻击者，以及对安全相关概念的一些误解。这篇论文分析了一些近期知识保护方法的漏洞，以提高人们对其实际有效性及其相互差异的认识。

关键字列表

多学科主题和应用->MDA：安全和隐私
知识表示和推理->概述

J5946号

学习设计公平和私人投票规则（扩展摘要）

Farhad Mohsin、Ao Liu、Pin-Yu Chen、Francesca Rossi、Lirong Xia

[+]更多

[-]更少

投票被广泛用于汇总偏好，以做出集体决策。在本文中，我们专注于评估和设计投票规则，这些规则既支持投票代理人的隐私，也支持对这些代理人的公平概念。首先，我们引入了一个新的组公平概念，并采用了现有的局部差异隐私概念。然后，我们评估了几种现有投票规则中的组公平水平，以及公平和隐私之间的权衡，表明不可能总是以高公平获得最大的经济效率。然后，我们提出了一种机器学习和约束优化方法来设计新的公平投票规则，同时保持较高的经济效率。最后，我们实证检验了添加噪音对创建本地差异私人投票规则的影响，并讨论了经济效率、公平和隐私之间的三方权衡。

关键字列表

博弈论与经济范式->GTEP：计算型社会选择
AI道德、信任、公平->ETF：公平和多样性
多学科主题和应用->MDA：安全和隐私

J5948号

Conjure：从问题规范自动生成约束模型（扩展抽象）

奥祖尔·阿奎恩、艾伦·M·弗里希、伊恩·普·根特、克里斯托弗·杰斐逊、伊恩·米格尔、彼得·南丁格尔

[+]更多

[-]更少

在求解组合问题时，问题的公式或模型对求解器的效率至关重要。鉴于开发特定问题的有效模型所需的专业知识和时间，自动化建模过程一直备受关注。我们描述了一种从用抽象约束规范语言Essence编写的问题规范自动生成约束模型的方法。我们的方法是通过在每个步骤中应用选定的细化规则，将规范逐步细化为具体模型。任何非平凡的规范都可以通过多种方式进行细化，从而创建一个可供选择的模型空间。对称性的处理是自动化建模的一个特别重要的方面。我们展示了在细化过程中，当模型对称性进入模型时，如何自动打破模型对称性，从而无需在模型公式化后进行昂贵的对称性检测步骤。我们的方法是在一个名为Conjure的系统中实现的。我们将Conjure生成的模型与已知有效的文献中的约束模型进行了比较。我们的实证结果证实，Conjure可以成功地重现文献中发现的42个基准问题的约束模型的核心。

关键字列表

约束满足和优化->CSO：约束编程
约束满足和优化->CSO：建模

J5949型

优化DLN中覆盖的计算（扩展抽象）

皮耶罗·A·博纳蒂、伊利亚娜·彼得罗娃、路易吉·索罗

[+]更多

[-]更少

性能是阻碍应用程序采用非单调描述逻辑的因素之一。即使当单调推理和非单调推理具有相同的渐近复杂性时，非单调推理的实现可能会慢得多。非单调逻辑DLN家族也不例外。我们通过为DLN中的推理引入两个可证明正确且完全的优化来解决这个问题。第一个优化是模块提取器，其目的是将推理集中在知识库的相关子集上。第二种方法称为乐观评估，旨在更好地利用增量推理。广泛的实验评估表明，优化的DLN推理通常与交互式查询应答兼容，从而使非单调描述逻辑更接近实际应用。

关键字列表

知识表示与推理->KRR：非单调推理
知识表示和推理->KRR：描述逻辑和本体
知识表示与推理->KRR：语义Web

J5950型

基于梯度的符号和数字动作参数混合规划（扩展抽象）

金克兵、朱汉奎、肖占浩、海万、苏巴拉奥·坎巴巴蒂

[+]更多

[-]更少

在现实世界的动态环境中，处理具有逻辑关系和数字变化的规划问题具有挑战性。现有的求解该问题的数值规划系统往往将数值变量离散化或对数值变量施加凸约束，这在解决问题时会损害性能，特别是当问题包含障碍物和非线性数值效应时。在这项工作中，我们提出了一种新的算法框架，用于解决混合了逻辑关系和基于梯度下降的数值变化的数值规划问题。我们将具有逻辑关系和数值变化的数值规划问题视为一个优化问题。具体来说，我们扩展了语法，允许动作模型的参数为对象或实值数字，这增强了模拟真实数字效果的能力。基于扩展建模语言，我们提出了一个基于梯度的框架，以同时优化数值参数并计算适当的操作以形成候选计划。基于梯度的框架由一个基于命题操作的算法启发式模块组成，用于选择动作并生成梯度下降的约束，一个用于将状态更新到下一个状态的算法转换模块，以及一个用于计算损失的损失模块。我们通过更新数值参数反复最小化损失，并计算候选计划，直到它收敛到规划问题的有效计划。

关键字列表

规划和调度->PS：混合离散/连续规划
计划和调度->PS：计划算法