使用半强盗反馈反复玩网络阻断游戏-ePrints Soton

郭庆余,安、波和朗特朗 (2017) 使用半强盗反馈反复玩网络阻断游戏。在第二十六届国际人工智能联合会议（IJCAI-17）。 9页.（新闻稿）

记录类型：会议或研讨会项目（纸张）

摘要

我们研究了在没有对手和环境先验知识的情况下的重复网络阻断游戏，该游戏可以模拟许多真实的网络安全域。现有的作品往往需要为防守球员提供大量可用信息，而忽视了双方球员之间的频繁互动，这是不现实和不切实际的，因此不适合我们的设置。因此，我们通过应用对抗性在线学习方法，提供了第一种防御策略，具有良好的理论和实际性能保证。特别地，我们将无先验知识的重复网络阻断博弈建模为一个在线线性优化问题，为此提出了一种新颖高效的在线学习算法SBGA，该算法利用了网络安全域中独特的半强盗反馈。我们证明，与事后最优固定策略和近似最优自适应策略相比，SBGA对自适应对手的攻击具有次线性遗憾。大量实验也表明，SBGA在收敛速度上明显优于现有方法。

文本

网络流阻断游戏中的在线学习-接受的手稿

根据许可证提供Creative Commons GNU GPL（软件）.

下载（3 MB）

标识符

本地EPrints ID：411950

URI（URI）：http://eprints.soton.ac.uk/id/eprint/411950

纯UUID：b81f5918-ba9a-43ac-972e-a5310e53aa00

的ORCIDLong Tran-Thanh公司:

orcid.org/0000-0003-1617-8316

目录记录

存放日期：2017年7月3日16:31

上次修改时间：2024年3月15日15:05

导出记录

共享此记录

在Facebook上共享在推特上分享在微博上分享

贡献者

作者：郭庆余

作者：保安

作者： Long Tran-Thanh公司

下载统计信息

去年从ePrints下载。也可以从出版商网站下载其他数字版本。

查看更多统计信息

图书馆工作人员附加信息

使用半强盗反馈反复玩网络阻断游戏

摘要

更多信息

标识符

目录记录

导出记录

共享此记录

贡献者

下载统计信息