×

DeepStack公司

swMATH ID: 27097
软件作者: 莫拉夫切克,马泰吉;马丁·施密德(Martin Schmid);尼尔·伯奇;维利亚姆·利西;达斯汀·莫里尔;诺兰·巴德;特雷弗·戴维斯;Waugh,Kevin;迈克尔·约翰逊(Michael Johanson);迈克尔·保龄球
描述: DeepStack:在无限制扑克中的专家级人工智能。近年来,人工智能取得了一些突破,游戏往往成为里程碑。这些游戏的一个共同特点是玩家拥有完美的信息。扑克是不完全信息的典型游戏,是人工智能中一个长期存在的挑战性问题。我们介绍了DeepStack,一种用于不完全信息设置的算法。它结合了递归推理来处理信息不对称,分解以将计算集中于相关决策,以及一种通过深度学习从自演中自动学习的直觉形式。在一项涉及44000手扑克的研究中,DeepStack击败了职业扑克玩家,这在统计学上具有显著意义。该方法在理论上是合理的,并且证明所产生的策略比以前的方法更难以利用。
主页: https://arxiv.org/pdf/1701.01724.pdf
相关软件: 天秤座;普里巴斯;游戏萎缩;字母零;AlexNet公司;ImageNet公司;目的地;动态记录仪2vec;亚当;令人惊叹的;张紧器2传感器;R-最大;SPMGBA公司;瞪羚;古罗比;黑斑羚;OpenAI健身房;TORCS公司;多巴胺;DeepMind实验室
引用于: 26文件
全部的 前5名

80位作者引用

6 维利亚姆·利斯
4 科瓦西克,沃伊特
布拉尼斯拉夫·博桑斯克
迈克尔·保龄球
尼尔·伯奇
克里斯蒂安·克罗尔
托马斯·桑德霍姆。
2 诺兰·巴德
2 Čermák,吉里耶
2 甘兹弗里德,萨姆
2 卡雷尔·霍拉克
2 马丁·施密德。
2 凯文·沃(Kevin G.Waugh)。
1 塔梅尔·巴沙尔
1 马克·贝勒马尔(Marc G.Bellemare)。
1 迪米特里斯·约翰·伯西马斯
1 斯特凡诺·邦齐奥
1 诺姆·布朗
1 威廉·卡巴列罗。
1 马蒂奥·卡斯蒂格利奥尼
1 安东尼奥·塞拉尼
1 萨拉斯·钱达尔
1 陈思奇
1 陈宇奇
1 特雷弗·戴维斯
1 文森特·杜穆林
1 伊恩·邓宁
1 冯小元
1 托马索·弗拉米尼奥
1 Jakob N.Foerster。
1 马西莫·福纳西耶
1 尼古拉·加蒂
1 郭兆宇
1 哈,卡雷尔
1 爱德华·休斯。
1 Janson,Natalia B。
1 姜、韩
1 迈克尔·约翰逊
1 欧文·库乌
1 克里斯托弗·基金特维尔(Christopher D.Kiekintveld)。
1 法塔玛省科林卡赞
1 蒂莫·科洛克
1 克洛登,彼得·埃里斯
1 马克·兰科特
1 雨果·拉罗谢尔
1 刘帅
1 布赖恩·J·午餐。
1 阿尔贝托·马切西
1 安德烈亚·马佐利尼
1 苗族、美夏
1 莫伊特拉,副警长
1 马特伊·莫拉维克
1 达斯汀·莫里尔
1 希布尔·穆拉德
1 奥斯汀诺瓦克
1 埃米利奥·帕里索托
1 亚历克斯·帕斯科夫
1 米查尔·普乔切克
1 亚历山大·佩萨科维奇
1 乔安尼尔·皮纳莱斯
1 Michael Rauchensteiner,迈克尔
1 任一龙
1 朱利亚诺·罗塞拉
1 杰弗里·罗森塔尔。
1 鲁道夫,简
1 Frederic Paik勋伯格
1 多米尼克·塞茨
1 埃里克·索多姆卡
1 宋·弗朗西斯
1 斯蒂尔·摩西(Stier-Moses),尼科拉斯·E·。
1 苏然
1 孙硕
1 理查德·尤伯(Richard P.Uber)。
1 谢,易
1 杨卓然
1 于海阳
1 法扎纳·优素福
1 张凯庆
1 张晓宇
1 朱凯文·X。

按年份列出的引文