×

利用深度Q网络和正交互补设计构造对称正交设计。 (英语) Zbl 07512635号

摘要:正交设计(OD)的构造在过去几十年中受到了广泛关注,以前的工作要么源于数学理论,要么源于算法搜索。提出了一种构造对称OD的新算法。它建立在一个精心设计的顺序构造框架上,结合了深度Q网络(DQN)和正交互补设计(OCD)。通过高效地构造各种非同构OD,DQN-OCD算法显示了其优越性。特别是对称OD的构造,包括饱和OD(mathcal{左}_{27}(3^{13}),\(\mathcal{左}_{28}(2^{27})和非饱和ODs(mathcal{左}_{18} (3^7),(mathcal{左}_{36}(3^{13})),其中DQN-OCD算法的性能优于其他算法。此外,在\(\mathcal)的非同构子类中的一系列先前未知的OD{左}_{28}(2^{27})和(mathcal{左}_{36}(3^{13})被构造为新的OD集合。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Bose,R.C。;Bush,K.A.,强度二和强度三的正交数组,Ann.Math。统计,508-524(1952)·Zbl 0048.00803号
[2] Brown,N。;Sandholm,T.,多人扑克的超人AI,《科学》,365885-890(2019)·Zbl 1433.68316号
[3] A.戴伊。;Mukerjee,R.,分数因子计划(1999),John Wiley&儿子:John Wiley&Sons纽约·Zbl 0930.62081号
[4] 埃文格拉拉斯,H。;库库维诺,C。;Lappas,E.,18-run非同构三层正交数组,Metrika,66,31-37(2007)·Zbl 1433.62231号
[5] 方,K.-T。;Ke,X。;Elsawah,A.M.,通过调整阈值接受算法构建均匀设计,J.Complex。,43, 28-37 (2017) ·Zbl 1391.62150号
[6] 方,K.-T。;Lin,D.K。;Winker,P。;张勇,《制服设计:理论与应用》,《技术计量学》,第42期,第237-248页(2000年)·Zbl 0996.62073号
[7] Fontana,R.,最小尺寸正交分式阶乘设计的代数生成:一种基于整数线性规划的方法,Comput。统计,28,241-253(2013)·Zbl 1305.65038号
[8] 加利尔,Z。;Kiefer,J.,与Mitchell的detmax有关的用于寻找d-最优设计的节省时间和空间的计算机方法,《技术计量学》,22301-313(1980)·Zbl 0459.62060号
[9] Hedayat,A.S。;斯隆,N.J.A。;Stufken,J.,《正交阵列:理论与应用》(1999),施普林格出版社:柏林施普林格·Zbl 0935.05001号
[10] 辛顿,G。;邓,L。;Yu,D.,语音识别中声学建模的深度神经网络,IEEE信号处理。Mag.,29(2012)
[11] 黄伟强。;Zhao,X.W.,用于解决正交阵列问题的准物理和准社会学算法,J.Comput。Res.Dev.,39,205-212(2002)
[12] 柯克帕特里克,S。;盖拉特,C.D。;Vecchi,M.P.,《模拟退火优化》,《科学》,220671-680(1983)·Zbl 1225.90162号
[13] Krizhevsky,A。;Sutskever,I。;Hinton,G.E.,用深度卷积神经网络进行Imagenet分类,(神经信息处理系统进展(2012)),1097-1105
[14] Lam,C。;Tonchev,V.D.,仿射可分解2-(27,9,4)设计的分类,J.Stat.Plan。推理,56,187-202(1996)·Zbl 0874.05009号
[15] LeCun,Y。;Bengio,Y.,图像、语音和时间序列的卷积网络(《大脑理论和神经网络手册》,第3361卷(1995年))
[16] LeCun,Y。;博图,L。;Y.本吉奥。;Haffner,P.,《基于梯度的学习应用于文档识别》,Proc。IEEE,86,2278-2324(1998)
[17] 马,C.-X。;方,K.-T。;Liski,E.,构建正交和近似正交阵列的新方法,Metrika,50255-268(2000)·Zbl 1093.62563号
[18] Miller,A.J。;Nguyen,N.-K.,Algorithm as 295:用于d-最优设计的Fedorov交换算法,J.R.Stat.Soc.,Ser。C、 申请。Stat.,43,669-677(1994)
[19] Mnih,V。;Kavukcuoglu,K。;Silver,D.,用深度强化学习玩atari,(NIPS深度学习研讨会(2013))
[20] Mnih,V。;Kavukcuoglu,K。;Silver,D.,《通过深度强化学习实现人性化控制》,《自然》,518529-533(2015)
[21] Nguyen,N.-K.,《构建过饱和设计的算法方法》,《技术计量学》,38,69-73(1996)·兹比尔0900.62416
[22] Rao,C.R.,可从阵列组合安排导出的析因实验,补充J.R.Stat.Soc.,9,128-139(1947)·Zbl 0031.06201号
[23] Schoen,E.D。;Eendebak,P.T。;Nguyen,M.V.,纯级和混合级正交数组的完全枚举,J.Comb。设计。,18, 123-140 (2010) ·Zbl 1287.05017号
[24] Seiden,E.,《关于正交数组的构造问题》,《数学年鉴》。Stat.,25,151-156(1954)·兹比尔0055.00703
[25] 西尔弗·D。;黄,A。;Maddison,C.J.,《掌握深度神经网络和树搜索的游戏》,《自然》,529,484-489(2016)
[26] 西尔弗·D。;休伯特,T。;Schrittwieser,J.,掌握国际象棋、shogi并进行自我游戏的通用强化学习算法,《科学》,362,1140-1144(2018)·Zbl 1433.68320号
[27] 西尔弗·D。;施里特维泽,J。;Simonyan,K.,《在没有人类知识的情况下掌握围棋游戏》,《自然》,550,354-359(2017)
[28] Simonyan,K。;Zisserman,A.,《用于大规模图像识别的深度卷积网络》(2014),arXiv预印本
[29] 斯隆,N.J.A.,《整数序列在线百科全书》(1999),非同构正交数组OA的数量(4n,4n-1,2,2)(A048885)
[30] Sloane,N.J.A.,《正交数组库》(2005)
[31] 翁L.-C.,《正交设计的分类和选择》(2020),香港浸会大学,哲学硕士论文
[32] 韦斯顿,J。;肖普拉,S。;Adams,K.,#tagspace:来自hashtags的语义嵌入,(2014年自然语言处理经验方法会议论文集(EMNLP)(2014)),1822-1827
[33] Xu,H.,构造混合水平和小游程正交和近正交阵列的算法,《技术计量学》,44,356-368(2002)
[34] Xu,H。;程,S.-W。;Wu,C.J.,因子筛选和交互检测的最优投影三水平设计,技术计量学,46280-292(2004)
[35] Xu,H。;Phoa,F.K。;Wong,W.K.,非规则分数阶乘设计的最新发展,统计调查。,3, 18-46 (2009) ·Zbl 1300.62056号
[36] 张,X。;赵,J。;LeCun,Y.,用于文本分类的特征级卷积网络,(神经信息处理系统进展(2015)),649-657
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。