×

学习在围棋比赛中得分。 (英文) Zbl 1086.68597号

小结:本文研究了机器学习技术在围棋比赛中得分任务中的应用。神经网络分类器经过训练,可以根据标记为9的游戏记录对生死进行分类。将其性能与统计模式识别中的标准分类器进行了比较。使用递归分类框架迭代地提高性能。使用最多四次迭代,我们的级联评分体系结构(CSA\(^*\))对98.9%的位置进行了正确评分。几乎所有得分错误的位置都会被识别出来(可以由操作员进行纠正)。通过提供可靠的分数信息,CSA*为自动提取人类游戏记录中隐含的围棋知识提供了大量来源。因此,它为机器学习在围棋中的成功应用铺平了道路。

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
91A43型 涉及图形的游戏
68T05型 人工智能中的学习和自适应系统

软件:

公关工具
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] D.B.本森(D.B.Benson),《围棋中的生活,通知》(Life in the game of Go,Inform)。科学。10(1976)17-29(再版于:D.N.L.Levy(Ed.),《计算机游戏》,第二卷,Springer-Verlag,纽约,1988年,第203-213页)ISBN 0-387-96609-9。;D.B.本森,围棋游戏中的生活,通知。科学。10(1976)17-29(再版于:D.N.L.Levy(Ed.),《计算机游戏》,第二卷,Springer-Verlag,纽约,1988年,第203-213页)ISBN 0-387-96609-9。
[2] Bouzy,B。;Cazenave,T.,《计算机围棋:一项面向人工智能的调查》,《人工智能》,第132、1、39-102页(2001年)·Zbl 0983.68152号
[3] Chen,K。;陈,Z.,围棋中生死的静态分析,Inform。科学。,121, 113-134 (1999)
[4] Dahl,F.,Honte,一个使用神经网络的围棋程序,(Fürnkranz,J.;Kubat,M.,《学会玩游戏的机器》(2001),新星科学出版社:新星科学出版社,纽约州亨廷顿),205-223,(第10章)
[5] 德克尔,S.T。;van den Herik,H.J。;Herschberg,I.S.,《复杂性从五开始》,ICCA J.,10,3,125-138(1987)
[6] R.Duin,PRTools,模式识别的Matlab工具箱(2000)。URL;R.Duin,PRTools,模式识别的Matlab工具箱(2000)。统一资源定位地址
[7] H.Enderton,《Golem Go程序》,技术报告CMU-CS-92-101,卡内基梅隆大学计算机科学学院,1991年12月。URL;H.Enderton,《Golem Go程序》,技术报告CMU-CS-92-101,卡内基梅隆大学计算机科学学院,1991年12月。统一资源定位地址
[8] M.Enzenberger,《将先验知识集成到围棋神经网络中》,未出版手稿,1996年9月。URL;M.Enzenberger,《将先验知识集成到围棋神经网络中》,未出版手稿,1996年9月。统一资源定位地址
[9] Fotland,D.,《围棋多面孔的静态眼睛分析》,ICGA J.,25,4,201-210(2002)
[10] 自由软件基金会,Gnu-Go(2003)。网址;自由软件基金会,Gnu-Go(2003)。统一资源定位地址
[11] Jain,A.K。;Duin,R.P.W。;Mao,J.,《统计模式识别:综述》,IEEE Trans。模式分析。机器。智力。,22, 1, 4-37 (2000)
[12] Lichtenstein,D。;Sipser,M.,Go是多项式空间的硬函数,J.ACM,27,2,393-401(1980)·Zbl 0434.68028号
[13] Müller,《安全行事:通过使用静态规则和搜索识别计算机中的安全区域》,摘自:H.Matsubara(Ed.),Proc。1997年日本游戏编程研讨会,计算机Shogi协会,日本东京,1997年,第80-86页。;Müller,《安全行事:通过使用静态规则和搜索识别计算机中的安全区域》,摘自:H.Matsubara(Ed.),Proc。1997年日本游戏编程研讨会,计算机Shogi协会,日本东京,1997年,第80-86页。
[14] Müller,M.,计算机围棋,人工智能,134,1-2,145-179(2002)·Zbl 0982.68120号
[15] Müller,个人沟通,2003年。;M.Müller,《个人沟通》,2003年。
[16] NNGS,《无名围棋服务器游戏档案》,2002年。URL;NNGS,《无名围棋服务器游戏档案》,2002年。统一资源定位地址
[17] J.M.Robson,围棋的复杂性,收录于:1983年IFIP世界计算机大会,第413-417页。;J.M.Robson,围棋的复杂性,收录于:1983年IFIP世界计算机大会,第413-417页。
[18] 北施拉多尔夫。;大研,P。;Sejnowski,T.,围棋游戏中位置评估的时间差异学习,(Cowan,J.D.;Tesauro,G.;Alspector,J.,神经信息处理进展,第6卷(1994),Morgan Kaufmann:Morgan Kaufmann,加利福尼亚州旧金山),817-824,URL
[19] J.van der Steen,Gobase.org-Go games,围棋信息和围棋学习工具,2003年。URL;J.van der Steen,Gobase.org-Go games,围棋信息和围棋学习工具,2003年。统一资源定位地址
[20] Tesauro,G.,时间差异学习和TD-Gammon,Commun。ACM,38,3,58-68(1995),网址
[21] 范德沃夫,E.C.D.,阿雅赢得(9次9次)围棋比赛,ICCA J.,26,4,263(2003)
[22] 范德维尔夫,E.C.D。;van den Herik,H.J。;Uiterwijk,J.W.H.M.,《解决小型电路板上的Go问题》,ICGA J.,26,2,92-107(2003)
[23] E.C.D.van der Werf,H.J.van den Herik,J.W.H.M.Uiterwijk,《学习在围棋游戏中估计潜在区域》,摘自:Proc。第四国际。计算机与游戏大会(CG'04)(Ramat-Gan,以色列,7月5-7日),计算机科学讲稿,柏林斯普林格,2004年。;E.C.D.van der Werf,H.J.van den Herik,J.W.H.M.Uiterwijk,《学习在围棋游戏中估计潜在区域》,摘自:Proc。第四国际。计算机与游戏会议(CG’04)(Ramat Gan,以色列,7月5-7日),《计算机科学讲义》,施普林格,柏林,2004年·Zbl 1086.68597号
[24] E.C.D.van der Werf,J.W.H.M.Uiterwijk,E.O.Postma,H.J.van den Herik,围棋中的局部移动预测,收录于:J.Schaeffer,M.Muller,Y.Björnsson(编辑),计算机与游戏:第三届国际会议,CG 2002,加拿大埃德蒙顿,2002年7月:(修订论文),计算机科学讲义,第2883卷,Springer-Verlag,2003,第393-412页。;E.C.D.van der Werf,J.W.H.M.Uiterwijk,E.O.Postma,H.J.van den Herik,围棋中的局部移动预测,收录于:J.Schaeffer,M.Muller,Y.Björnsson(编辑),计算机与游戏:第三届国际会议,CG 2002,加拿大埃德蒙顿,2002年7月:(修订论文),计算机科学讲义,第2883卷,Springer-Verlag,2003,第393-412页。
[25] E.C.D.van der Werf、M.H.M.Winands、H.J.van den Herik、J.W.H.M.Uiterwijk,《从围棋游戏记录中学习预测生死》,Inform。科学。175 (2005) 258-272.; E.C.D.van der Werf、M.H.M.Winands、H.J.van den Herik、J.W.H.M.Uiterwijk,《从围棋游戏记录中学习预测生死》,Inform。科学。175 (2005) 258-272.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。