LUDAE项目

 转到主页 下一个。。。

学术知识

学院的宗旨是为参赛者之间的合作提供场所玩家。这种合作转化为一系列关于正在玩的游戏。这些知识主要是经验的产物由连续比赛中举行的比赛收集。另一个知识将通过积极的游戏分析和学习提供。

模式

模式是一种编码方式继续玩知识游戏。A类图案是某个板位置,用数字元组标记,图案签名.该签名由以下内容组成:(a)提议该模式的球员人数,(b)这些球员的平均ELO,(c)该位置的预期值,这值范围从0.0(预期损失)到1.0(预期胜利),(d)什么玩家是我们的地址(1代表第一个玩家,2代表第二个玩家)。

接下来是两个图案示例:


#-x b
#-o个-
-x-w


< 3; 165; 0.78; 2 > 

-w个
#-o个
#-x个#
-哦-
- -

< 1; 700; 0.12; 1 > 

左元组<3;165;0.78;2>意思是:3名玩家平均ELO为165,建议此模式有价值第二名球员为0.78。

第一行给出了本地板区域(方形板的左侧从六角板上取下)。其中可能的字母和含义区域是(让我们假设第一个玩家使用黑色,第二个玩家使用白色玩家):

-,空牢房
x,黑人士兵
b条,黑人国王
B类,一块黑色的(士兵或国王)
1,没有白色碎片的细胞
o个,白人士兵
w个,白人国王
W公司,一块白色的
2,没有黑色碎片的电池
+,非单元格(用于定义板边和角)
#,任何东西

对称的游戏

对于对称游戏,所有模式都转换为第一玩家模式。当发生第二次玩家评估时,所有模式匹配都将被反转。这有助于减少可能的模式的空间,并增强更好的播放效果。

图案数据库

比赛开始时,玩家将插入相关模式(因此他们假设)。在学院内部,匹配过程进行了比较每个新的模式都已经保存了可用的模式数据库(pdb)。什么之中的一个可能会发生以下情况(让模式签名<n,e,v,p> ):

这个模式与已知模式匹配-图案签名<N,E、 使用以下程序更新V,P>:
这个玩家数量更新为1,即新N=N+1
这个平均ELO更新为,新E=(E*N+E)/(N+1)
这个预期模式值更新为,新V=(E*V*N+e*v)/(N+1)
这个图案可以通过以下过程进行匹配一般化.
这个图案可以通过以下过程进行匹配专业化.
这个模式与任何已知模式都不匹配-图案包括在内进入pdb。

一般化

签名<N的新图案AA类,EA类,VA类,P(P)A类>可以通过泛化将已知模式B与签名匹配<牛顿B类,EB类,VB类,PB类>如果他们满足以下标准:

E类B类+200>东经A类>E类B类- 200 (也就是说,非常糟糕玩家不应该贬低已知知识,而优秀的玩家应该尝试将其专门化-请参阅下一节)
P(P)A类应与P兼容B类(也就是说,它是一样的玩家或游戏是对称的)
这个两个板位必须具有相同的非空白区域和相同的工件位置。在以下情况下可以覆盖此规则:在单元格上通过单元格比较(为了简单起见,我只介绍了第一个玩家案例),如果发现一对:
它是为了
x b条或B B类
b条 B类 B类
- x或b或b 1
x或b或b o个或w或w #*

*只有在以下两种情况下才能使用don’t care(#)信号模式给出了严格的积极评价(>0.66)或严格的负面评价(<0.33)。这意味着工件颜色为与评估此模式无关。

专业化

签名<N的新图案AA类,EA类,VA类,P(P)A类>可以通过专门化将已知模式B与签名匹配<牛顿B类,EB类,伏B类,PB类>如果他们满足以下标准:

E类A类>E类B类+ 200
P(P)A类应与P兼容B类
这个两个板位必须具有相同的面积和相同的工件位置。在以下情况下可以覆盖此规则:在单元格上通过单元格比较(为了简单起见,我只介绍了第一个玩家案例),如果发现一对:
A类 B类 它是为了
x B类 x
b条 B类 b条
x或b或b 1 B类
x或b或b # #*
(x)或b)或b # B类或1**

*只有在以下两种情况下才能使用don’t care(#)信号模式给出了严格的积极评价(>0.66)或严格的阴性评价(<0.33)。这意味着工件颜色为与评估此模式无关。
**
这适用于其他情况,其中期望值不是明确甚至矛盾。

图案图书馆

要找到一个完美的围棋选手,他必须
开幕式上的一位禅宗佛教徒
一位道士
最后是一个儒家!
比尔·泰勒

本节讨论玩家如何选择模式的问题。它是通常用于将游戏树划分为三个不同的部分:开始,中场和终场(或使用围棋术语:富斯基、楚班和尤斯)。这个ACADEMY将这些图案中的每一个保留在不同的部分,并进行形状它们不同。

正在打开

此部分将保留报告中使用的游戏(或只是动作描述列表,以节省内存)竞赛。这组动作将慢慢构建一棵可能的空缺树(称为Fuseki图书馆开放理论游戏的),保存到达该位置的所有玩家的平均期望值,加上所有报道的赢、输和平局。

Fuseki库应该有一个固定的最大限制(比如1000个节点)和一个最大深度(平均游戏长度的1/3)。当它装满时,叶子应删除较小的预期值(节点N的值=N的预期值/树深度N)并更新父节点的赢/输/抽比率)。

还有一个修剪过程,说明当叶子对于某个节点,具有所有负值,删除这些节点(并更新父节点),并且高度降低该节点的预期值。

中间游戏

Chuban库由一组模式组成(就像上面定义的那样)。每个模式都是一个好的战术动作本地区域(在Go中,称为Tesuji)。 

这个库也应该受到最大大小的限制(比如1000个模式)。填满后,应删除最弱的图案。A模式<N、E、V、P>值为N*E*(0.5-V)2.

结束游戏

Yose库(或终局理论)和其他人一样,应该有一个最大尺寸(但更大的尺寸,可能是5000个图案)以保持在报道的比赛中收集的模式。

如果存在以下限制之一,则会将模式添加到Yose库中满意的:

是最终位置(赢、输或平)。
如果该模式来自平均比赛最后20%以内的移动长度。
然后,模式应乘以游戏(这是由学院进行的事后分析,其中结果是已知的)。
如果结果是一场胜利,将平方根应用于预期值
如果结果是损失,将期望值乘以本身(即平方)
如果结果是平局,平均值为0.5

如前所述,Endgame模式也可以被泛化和专门化。这个删除过程与Chuban库中的相同。

使用学院

玩家不应该只使用这些库的知识。那会的放慢并最终冻结学习过程。任何图书馆的使用应限制在25%以内,用于开始协商,以及中期和终局应该限制在期望值很低的位置。具有ELO E的玩家只能接受来自平均分模式的提议ELO大于E-200。

虽然更新Fuseki和Yose库是ACADEMY,中间游戏中的模式插入(如前所述)是一个活动玩家进程(即使是这样,在比赛结束时库也会更新)。模式插入应该有严格的标准(否则库会很快被无用的图案淹没)。目前,我发现最好的标准是:

如果ELO E玩家与ELO对手比赛大于E-100,并且某个移动会使预期值增加20%,(如果从低于0.5到高于0.5,则为10%),比赛是平局还是平局,然后将图案发布到ACADEMY!

这个世界语解决方案

关于学院的一个问题是如何在以便在不同的玩家之间分享共同的知识。这个问题是通过使用模式和移动列表解决,因为这些都包含在所有玩家都知道的共同语言:游戏本身!

游戏措施

学院还将从竞技场接收有关玩家实际比赛的持续信息报告,以便维护和更新游戏度量值已经讨论.


转到顶部
转到主页 下一个。。。