DeepStack公司 swMATH ID: 27097 软件作者: 莫拉夫切克,马泰吉;马丁·施密德(Martin Schmid);尼尔·伯奇;维利亚姆·利西;达斯汀·莫里尔;诺兰·巴德;特雷弗·戴维斯;Waugh,Kevin;迈克尔·约翰逊(Michael Johanson);迈克尔·保龄球 描述: DeepStack:在无限制扑克中的专家级人工智能。近年来,人工智能取得了一些突破,游戏往往成为里程碑。这些游戏的一个共同特点是玩家拥有完美的信息。扑克是不完全信息的典型游戏,是人工智能中一个长期存在的挑战性问题。我们介绍了DeepStack,一种用于不完全信息设置的算法。它结合了递归推理来处理信息不对称,分解以将计算集中于相关决策,以及一种通过深度学习从自演中自动学习的直觉形式。在一项涉及44000手扑克的研究中,DeepStack击败了职业扑克玩家,这在统计学上具有显著意义。该方法在理论上是合理的,并且证明所产生的策略比以前的方法更难以利用。 主页: https://arxiv.org/pdf/1701.01724.pdf 相关软件: 天秤座;普里巴斯;游戏萎缩;字母零;AlexNet公司;ImageNet公司;目的地;动态记录仪2vec;亚当;令人惊叹的;张紧器2传感器;R-最大;SPMGBA公司;瞪羚;古罗比;黑斑羚;OpenAI健身房;TORCS公司;多巴胺;DeepMind实验室 引用于: 26文件 全部的 前5名80位作者引用 6 维利亚姆·利斯 4 科瓦西克,沃伊特 三 布拉尼斯拉夫·博桑斯克 三 迈克尔·保龄球 三 尼尔·伯奇 三 克里斯蒂安·克罗尔 三 托马斯·桑德霍姆。 2 诺兰·巴德 2 Čermák,吉里耶 2 甘兹弗里德,萨姆 2 卡雷尔·霍拉克 2 马丁·施密德。 2 凯文·沃(Kevin G.Waugh)。 1 塔梅尔·巴沙尔 1 马克·贝勒马尔(Marc G.Bellemare)。 1 迪米特里斯·约翰·伯西马斯 1 斯特凡诺·邦齐奥 1 诺姆·布朗 1 威廉·卡巴列罗。 1 马蒂奥·卡斯蒂格利奥尼 1 安东尼奥·塞拉尼 1 萨拉斯·钱达尔 1 陈思奇 1 陈宇奇 1 特雷弗·戴维斯 1 文森特·杜穆林 1 伊恩·邓宁 1 冯小元 1 托马索·弗拉米尼奥 1 Jakob N.Foerster。 1 马西莫·福纳西耶 1 尼古拉·加蒂 1 郭兆宇 1 哈,卡雷尔 1 爱德华·休斯。 1 Janson,Natalia B。 1 姜、韩 1 迈克尔·约翰逊 1 欧文·库乌 1 克里斯托弗·基金特维尔(Christopher D.Kiekintveld)。 1 法塔玛省科林卡赞 1 蒂莫·科洛克 1 克洛登,彼得·埃里斯 1 马克·兰科特 1 雨果·拉罗谢尔 1 刘帅 1 布赖恩·J·午餐。 1 阿尔贝托·马切西 1 安德烈亚·马佐利尼 1 苗族、美夏 1 莫伊特拉,副警长 1 马特伊·莫拉维克 1 达斯汀·莫里尔 1 希布尔·穆拉德 1 奥斯汀诺瓦克 1 埃米利奥·帕里索托 1 亚历克斯·帕斯科夫 1 米查尔·普乔切克 1 亚历山大·佩萨科维奇 1 乔安尼尔·皮纳莱斯 1 Michael Rauchensteiner,迈克尔 1 任一龙 1 朱利亚诺·罗塞拉 1 杰弗里·罗森塔尔。 1 鲁道夫,简 1 Frederic Paik勋伯格 1 多米尼克·塞茨 1 埃里克·索多姆卡 1 宋·弗朗西斯 1 斯蒂尔·摩西(Stier-Moses),尼科拉斯·E·。 1 苏然 1 孙硕 1 理查德·尤伯(Richard P.Uber)。 1 谢,易 1 杨卓然 1 于海阳 1 法扎纳·优素福 1 张凯庆 1 张晓宇 1 朱凯文·X。 全部的 前5名14篇连载文章中引用 8 人工智能 2 机器学习 2 科学类 2 游戏 1 物理A 1 运筹学 1 构造性近似 1 国际近似推理杂志 1 统计传播。模拟和计算 1 欧洲运筹学杂志 1 数学编程。A系列B系列 1 动力学和微分方程杂志 1 数学生物科学与工程 1 理论生物学杂志 全部的 前5名10个字段中引用 16 博弈论、经济学、金融和其他社会和行为科学(91-XX) 15 计算机科学(68-XX) 2 运筹学、数学规划(90-XX) 2 生物学和其他自然科学(92-XX) 1 常微分方程(34-XX) 1 动力系统和遍历理论(37至XX) 1 统计学(62-XX) 1 数值分析(65-XX) 1 统计力学,物质结构(82-XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文