文件Zbl 1532.11168-zbMATH Open

米勒·拉宾（Miller-Rabin）初等性测试中证人的明智选择。强化学习法。（英语） Zbl 1532.11168号

Lobachevskii J.数学。 43，第12号，3420-3429（2022）.

本文提出了一种新的选择概率Miller-Rabin素性检验所需试题库的方法，该方法使用基于强化学习（RL）的启发式算法，参见[R.S.萨顿和A.G.巴托，强化学习。引言。第二次扩展和更新版本。马萨诸塞州剑桥：麻省理工学院出版社（2018；Zbl 1407.68009号)].
众所周知，为了确定自然数的素性每一轮Miller-Rabin测试都需要一名目击者或基地（a），（2）。通常，这些碱基是按顺序或随机选择的。本文提供了一种机器学习方法。
第1节将强化学习描述为马尔可夫决策过程，表示一系列状态（s_i），操作\（a_i\）和函数\（\pi=\pi（s）\）将状态映射到操作中。本文还讨论了现有的不同强化学习算法。
第2节描述了Miller-Rabin试验强化学习的建模、训练和神经网络的理想特性。然后，本文使用三种不同的试验基地选择策略显示了训练动力学和数值结果（表1、2、3和4）。
作者的话是：“我们将我们的方法与两种最先进的启发式方法进行了比较，这两种启发式方法用于选择MR测试中的试验数量：顺序选择和随机选择。结果表明，所提出的方法平均需要最少的试验基数”。

审核人：胡安·特纳·阿尤索（巴利亚多利德）

引用于1文件

MSC公司：

11年11月	原始性
60J20型	马尔可夫链和离散时间马尔可夫过程在一般状态空间（社会流动、学习理论、工业过程等）上的应用
68T07型	人工神经网络与深度学习
第68页，共15页	数据库理论

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	阿格拉瓦尔，M。；皮划艇，北。；北卡罗来纳州萨克森纳，Primes在P，Ann.Math。，160, 781-793 (2002) ·Zbl 1071.11070号 ·doi:10.4007/annals.2004.160.781
[2]	Baillie，R。；Fiori，A。；Wagstaff，S.S.，《加强贝利-PSW初等性测试》，数学。计算。，90, 330 (2021) ·Zbl 1478.11152号 ·doi:10.1090/com/3616
[3]	R.Bellman，“马尔科夫决策过程”，印第安纳大学数学。J.，第6期，679-684（1957）·Zbl 0078.34101号
[4]	科恩，H。；Lenstra，H.W.，《素数测试和雅可比和》，《数学》。计算。，42, 297-330 (1984) ·Zbl 0578.10004号 ·doi:10.1090/S0025-5718-1984-0726006-X
[5]	克兰德尔，R。；Pomerance，C.B.，《素数：计算视角》，《统计学讲义》（2006），纽约：斯普林格出版社，纽约
[6]	Ishmukhametov，S。；穆巴拉克·B。；Rubtsova，R.，《关于Miller-Rabin素性测试中的证人数量》，《对称性》，12890（2020）·数字对象标识代码：10.3390/sym12060890
[7]	N.Mazyavkina、S.Sviridov、S.Ivanov和E.Burnaev，“组合优化的强化学习：调查”，“计算”。运营商。第134、105400号决议（2021年）·Zbl 1511.90356号
[8]	Miller，G.L.，Riemann的假设和素性检验，J.Compute。系统。科学。，13, 300-317 (1976) ·Zbl 0349.68025号 ·doi:10.1016/S0022-0000（76）80043-8
[9]	莫兰·F·阿特金的测试：来自前线的新闻，高级加密。，434, 626-635 (1989) ·Zbl 0734.68053号
[10]	Morain，F.，《素数证明的椭圆曲线》。《密码学与安全百科全书》（2005），纽约：Springer，纽约·Zbl 0908.11061号
[11]	M.J.Nelson和A.K.Hoover，“关于在人工智能教育中使用谷歌协作的说明”，载于《ACM ITiCSE会议录》（2020年），第533-534页。
[12]	拉宾，M.O.，《检验素性的概率算法》，《数论》，第12期，第128-138页（1980年）·Zbl 0426.10006号 ·doi:10.1016/0022-314X（80）90084-0
[13]	J.Schrittwieser、I.Antonoglou、T.Hubert、K.Simonyan、L.Sifre、S.Schmitt、A.Guez、E.Lockhart、D.Hassabis、T.Graepel、T.P.Lillicrap和D.Silver，“通过学习模型规划掌握atari、围棋、国际象棋和shogi”，CoRR，abs/1911.08265（2019）。
[14]	J.Schulman、F.Wolski、P.Dhariwal、A.Radford和O.Klimov，“近似策略优化算法”，CoRR，abs/1707.06347（2017）。
[15]	西尔弗·D。；黄，A。；Maddison，C.J。；A.盖兹。；Sifre，L。；van den Driessche，G。；Schrittwieser，J。；安东尼奥卢，I。；Panneershelvam，V。；Lanctot，M。；迪尔曼，S。；格雷，D。；Nham，J。；Kalchbrenner，N。；Sutskever，I.，《掌握深度神经网络和树搜索的游戏》，《自然》（英国伦敦），529，484-489（2016）·doi:10.1038/nature16961
[16]	Sutton，R.S。；Barto，A.G.，《强化学习——简介》。自适应计算和机器学习（1998），马萨诸塞州波士顿：麻省理工学院出版社
[17]	Wolfram，S.，《数学——用计算机做数学的系统》（1988），波士顿：Addison-Wesley，波士顿·Zbl 0671.65002号
[18]	张，Z.，寻找c3-强伪素数，数学。计算。，74, 1009-1024 (2005) ·Zbl 1069.11055号 ·doi:10.1090/S0025-5718-04-01693-X
[19]	张，Z.，关于几种新型伪素数的注记，数学。计算。，75, 451-460 (2006) ·Zbl 1092.11001号 ·doi:10.1090/S0025-5718-05-01775-8
[20]	张，Z.，两种强伪素数到1036，数学。计算。，76, 2095-2107 (2007) ·Zbl 1131.11082号 ·doi:10.1090/S0025-5718-07-01977-1
[21]	张，Z。；Tang，M.，找到几个基的强伪素数II，数学。计算。，72, 2085-2097 (2003) ·兹比尔1113.11007 ·doi:10.1090/S0025-5718-03-01545-X

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

米勒·拉宾（Miller-Rabin）初等性测试中证人的明智选择。强化学习法。（英语） Zbl 1532.11168号

MSC公司：

关键词：

引文：

软件：

参考文献：

示例

领域

操作员

米勒·拉宾（Miller-Rabin）初等性测试中证人的明智选择。强化学习法。 （英语） Zbl 1532.11168号

MSC公司：

关键词：

引文：

软件：

参考文献：

米勒·拉宾（Miller-Rabin）初等性测试中证人的明智选择。强化学习法。（英语） Zbl 1532.11168号