BiEntropy, TriEntropy and Primality

Croll, Grenville J.

doi:10.3390/e22030311

开放式访问编辑的选择第条

双熵、三熵和素数

通过

格伦维尔·J·克罗尔

英国Bury St Edmunds IP30 9QX另类自然哲学协会

熵 2020,22(3), 311;https://doi.org/10.3390/e22030311

收到的提交文件：2020年2月11日/修订日期：2020年3月2日/接受日期：2020年3月3日/发布日期：2020年3月10日

（本条属于本节信息论、概率论和统计学)

下载

浏览地物

审查报告版本注释

摘要

:

自然数的二进制表示的顺序和无序性<2⁸使用BiEntropy函数进行测量。质数和非质数之间存在显著差异。双熵素数密度是二次的，高斯分布误差很小。使用自然数样本的蒙特卡罗模拟以二进制形式重复此工作³²所有自然数均为三元⁹具有相似但立方的结果。我们发现双熵和三熵之间存在着显著的关系，因此我们可以区分素数和可被6整除的数。我们讨论了这些结果的理论基础，并展示了它们是如何推广以给出Pi方差的紧界的(x个)–李(x个)对所有人来说x个这个界限比冯·科赫（Von Koch）在1901年作为黎曼假设证明的等价物给出的界限要严格得多。由于对二元导数的简单归纳，素数是高斯的，这意味着孪生素数猜想是正确的。我们还提供了附录中费马素数和梅森素数的绝对收敛渐近线。

关键词：

素数分布;二元导数;三元导数;香农熵

图形摘要

1.简介

我们开发了双熵函数[1]作为比较任意长度二进制字符串的数字的相对顺序和无序的一种方法。

我们最初在素数理论、人类视觉、密码学、随机数生成和定量金融等领域测试了该算法。作为素数研究的副产品，我们导出了两个很短的推论，重申了素数常数的不合理性[2].

随后，我们使用双熵来确定9和10个交叉点的交替和非交替结之间的显著差异[三]在简单立方晶格中。我们的工作在密码学、互联网信息处理、移动计算和随机数生成领域被引用[4,5,6,7,8]. 最近，BiEntropy被重新实现、测试并在GitHub上公开[9]. 它在相关的美国政府专利中被显著引用[10].

尽管双熵在不同领域（尤其是素数理论）的使用和应用有着这样的背景，但到目前为止，我们还未能进行最简单的测试来确定双熵和素性之间是否存在任何关系。数学中素性问题的历史重要性和深刻根源最终促使我们开始了我们的研究。有大量关于素数理论的文献。资源，如[11,12,13,14,15]其中的参考文献提供了一个有用的背景。

在本文中，我们实证研究了8位和32位二进制字符串中的双熵和素性之间的关系。然后我们发展了三熵函数，并研究了它与9个三元弦内素性的关系。我们简要地研究了双熵和三熵之间的关系。最后，我们讨论了这项工作背后的理论基础，并展示了它是如何推广到所有自然数的。

本文中的所有研究、实验和计算工作都是在Microsoft Excel电子表格环境中进行的[16]. 这使我们在创作过程中具有极大的灵活性、高开发生产率以及显著的计算和图形功能。已经观察到这些属性[17,18]并可能促进这项工作的可及性和深入性，特别是在教育领域[19,20].

本文的布局反映了实验和理论工作的发生顺序，除了费马和梅森素数的工作被转移到附录B。我们在线提供了一套完整的电子表格，用于执行本文中的计算和图形。有关访问这些电子表格的详细信息，请参阅补充材料部分.

2.双熵

双熵算法使用香农熵的加权平均值[21]字符串和除最后一个二元导数以外的所有二元导数[22]字符串的。

2.1. 香农熵

二进制字符串的Shannon熵秒=秒₁, …,秒_n个其中P(秒_我= 1) =第页（和0日志₂0被定义为0）是：

H（H）(第页) = −p对数₂第页− (1 −第页)日志₂(1−第页)

(1)

对于全部为1或全部为0的完全有序字符串，即。，第页=0或第页= 1,H（H）(第页)返回0。在哪里？第页=0.5，H（p）返回1，反映最大变化。但是，对于字符串（例如01010101），其中第页=0.5，H（p）也返回1，完全忽略字符串的周期性。

我们可以通过字符串的二进制导数来发现二进制字符串的周期性。

2.2. 二元导数和周期性

的第一个二元导数秒，天₁(秒)，是长度为的二进制字符串n个−1由相邻的数字对进行异或运算形成。我们指的是k个的th导数秒,d日_k个(秒)作为的二元导数d日_k个−1（s） ●●●●。有n个−1的二元衍生物秒.第页(k个)是1的比例d日_k个.

大约五十年前，内森[22]，跟随Goka的工作[23]，定义了任意二进制字符串中的周期和最终周期的概念，并分别和集体概述了二进制字符串及其导数的相关属性。在许多有用的结果中，我们发现二进制字符串具有周期2米对一些人来说米≥0当且仅当d日_k个某些情况下为0k个≥ 1.

2.3. 双熵定义

双熵，简称BiEn，是字符串和第一个字符串的Shannon熵的加权平均值n个弦的−2个二元导数。有多种方法来加权香农熵。在这一系列实验中，我们使用2的幂来加权香农熵：

比恩 (秒) = (1 / (2^{n个 - 1} - 1)) (\sum_{k个 = 0}^{n个 - 2} (- 第页 (k个) \cdot {日志}_{2} 第页 (k个) - (1 - 第页 (k个)) \cdot {日志}_{2} (1 - 第页 (k个))) \cdot 2^{k个})

(2)

最终导数d日_n个−1没有使用，因为在其两个二进制状态中，对总熵的贡献没有变化。最高权重分配给最高导数d日_n个−2.

2.4. 双熵属性

BiEntropy提供一个介于0和1之间（含0和1）的数字，表示长度为二进制字符串的数字的相对顺序和无序性n个> 1. 最短的完全有序字符串是00和11，它们的BiEntropy为0。唯一完全无序的字符串是01和10，它们的双熵为1。例如，有序（即周期性）字符串（如01010101）的BiEntropy很低，为0.01。像10000110这样的无序字符串的BiEntropy很高，例如0.95。

3.自然数的双熵和素数<256

我们展示了图1小于256的自然数的双熵。行对应于最高有效数字，列对应于其二进制表示的最低有效数字。行和列分别按最高和最低有效数字的4位BiEntropy排序。双熵的颜色编码为白色<0.15、黄色<0.25、橙色<0.5和红色<1.0。注意图中对角线的对称性。底漆是紫色的。例如，5=00000101的8位双熵为0.23，根据对称性，它将被涂成黄色，但编码为紫色，因为它是（费马）素数。费马素数17=00010001由于其数字的周期性，其双熵较低，为0.05。它将被染成白色，但由于它的原始性而被染成紫色。此外，127=01111111的双熵为0.92，颜色为红色，但它不仅是素数，而且是梅森素数，颜色为紫色。注意，0和1只是“非素数”。

很容易看出，大多数素数都位于红色象限中，只有一个素数（费马素数）位于白色对角线上。注意，<256的自然数的素性与双熵的自然对称性存在差异，如图1.

四个素数比例之间的差异表1以下内容在第页< 0.01. 因此，我们发现了一种基于双熵或更普遍的二元导数的素数分割方法。在红色部分寻找8位素数的效率大约是在白色或黄色部分寻找的效率的九倍。

我们展示了表2下面是素数、非素数和复合奇数的双熵之间的明显区别第页自然数<256时<0.0001。四个梅森素数<256和33个孪生素数<256的双熵与所有<256的素数的双熵相似。因此，素数和小于256的复合比数为129，其中包括偶数素数。

如果我们按照BiEntropies对<256的自然数进行排序，并将其分为八个部分，如表3，最低和最高双熵段之间的素密度差异显著增大。

素密度π(x个)，素数小于或等于x、，大约为x个/在(x个)由于1896年雅克·哈达玛和查尔斯·德拉瓦莱·普桑的素数定理。双熵似乎将素密度修改为O（运行）(x个²)对于非常小的整数。因此，使用双熵或其他素数密度函数，我们可以有效地谈论q个(x个,年,我)它是我第个年按大小排序的间隔<x个.因此q个（256，32，8）等于14，如上所述。当然，π（256）=q个(256, 256, 1) = 54.

最后，我们用图形描述了双熵和素性之间的连续关系图2这揭示了一种几乎确定的关系。我们拟合了相关的自然对数和二次曲线，并显示了图3我们调整了自然对数曲线，使Log（256）与π(x个)在极限内完成。注意，双熵是二进制字符串的香农熵和第一个香农熵的加权平均值n个−字符串的2个二进制导数。未进行（显式）试算除法以计算BiEntropy。素数<256=54，素数<256的总双熵=42.64。

手段图3由于我们进行了小的乘法调整，结果是一致的。误差的标准偏差几乎相同，自然对数为0.93，二次方为0.98。因此，整数的双熵素数密度的实际误差x个<256表示<√x个日志(x个)显然是高斯分布。正如我们将看到的那样，误差收敛到0x个→ ∞.

4.自然数的双熵和素性<2³²

4.1. 素数和二元导数

而π(x个)~x个/在(x个)，计算长度字符串的双熵时使用的二进制导数的数量米（其中米=对数₂(x个))仅增加为(米²−米)/2. 我们展示了表4π之间的关系(x个)，素数和二元导数d日用于各种x个.

因此，d日/π（x）很快趋于0，这可能会使BiEntropy对较长字符串长度的素性不太敏感。

4.2. 香农熵的高次幂

有一些研究起源于算法信息理论[24]这表明，原始性与无序性有关，这当然是双熵设计用来衡量的。另一项工作不涉及在此过程中使用二进制导数。注意，对角线上只有一个素数图1，这是最大阶的区域。

我们可以改变双熵，以提高其对检测二元导数中任何偏离完美无序的情况的灵敏度。这很容易做到，特别是在电子表格环境中，因为我们可以简单容易地将每个二元导数的香农熵提高到大于1的幂。

我们展示了图4基于的Shannon熵幂从1提高到10的效果第页、品种。在图表中间变化最大的区域中，第页=0.5，Shannon熵最高。当使用更高的Shannon熵幂时，我们可以更有力地区分偏离最大无序。

4.3. 研究x<2的双熵和素性³²

我们使用基于电子表格的蒙特卡罗计算来研究自然数<2的样本³²。使用一个简单的Excel数据表，对于10000次迭代中的每一次，我们生成一个随机的32位整数，然后使用每个导数的香农熵的十次幂（P10 BiEntropy）计算其二次双熵。我们使用基于电子表格的详尽试分计算来确定每个随机32位整数的素数。然后，我们将采样的自然数及其双熵排序为双熵序，并将该有序区间的素数密度与样本的自然素数密度进行比较。我们展示了样本的自然质密度和双熵质密度之间的关系图5以及两种密度之间的差异图6.

4.4. 双熵和原始性的蒙特卡罗检验

我们决定仔细研究蒙特卡罗模拟产生的自然质密度和双熵质密度之间的微小差异，如图5以上。该模拟由10000个整数样本组成x个在0范围内<x个< 2³²由Excel RAND函数生成，我们之前已经仔细检查过[1]. 由于随机数将在给定范围内均匀生成（即线性生成），因此我们可以使用素数定理计算在给定范围生成10000个随机整数期间可能生成多少素数。然后，我们能够计算蒙特卡罗模拟的理论素数密度，以与蒙特卡罗仿真的实际素数密度进行比较。

我们显示了自然素数密度和双熵素数密度之间的实际差异或δ，以及理论预期差异或δ图6理论上的Delta（以橙色显示）仅占差异的一部分。双熵素数密度和自然素数密度之间的差异并不是由蒙特卡罗模拟中素数的线性产生率和自然素数密度之间的差别来解释的。差别要大得多。将预期差异平方并除以二（Delta²/2）与蒙特卡洛模拟的实际结果更加接近。经检查图6大致正常（平均值1.22和圣德芙6.17），为简洁起见省略了。对于以下整数，双熵素数密度似乎也是二次的O（运行）(2³²).

我们报道的蒙特卡罗模拟中实际产生的素数是391，而预期的素数为473。预计会有变化。

5.三熵

我们在以前的工作中注意到，BiEntropy函数对3的周期性不敏感（参见中18、27、36和54的条目表A1属于附录A). 例如，001001001001001的18位二次双熵为0.9484，表示无序，但字符串显然是周期性的。我们曾认为，发展一个与双熵等价的三元数可能会解决这个问题，但我们之前并没有这样做的动机。考虑到双熵和前几节中概述的素数之间的联系，以及所有≥5的素数都是6的形式k个±1，有明确的调查动机。

5.1. 两两加法与差分模3

对三熵的严格测试是，它在一个三元字符串中提取了3的周期性。我们设计了一个简单的双向两两三元加法表，如所示表5.

我们使用的两两三元加法表将我们的8位二进制双熵计算器电子表格转换为9三元三熵计算器电子表表5以上。这只花了几分钟。不幸的是，它不起作用。然后我们发现，在一个3三元字符串ABC中，我们需要计算三对AB、BC、AC、模3之间的三元两两三元差值（PTD）。因此，

PTD公司=国防部(防抱死制动系统(一−B类) +防抱死制动系统(B类−C类) +防抱死制动系统(一−C类), 3)

(3)

我们在里面展示的表6。在电子表格中又花了几分钟的时间来证明这确实有效。三个trit字符串各自的TriEntropies看起来并不乐观，但我们坚持我们的分析。注意，PTD函数在两两置换下是不变的，A、B或C都没有优先级。

5.2. 计算三熵

为了计算三元字符串的香农熵，我们需要第页_我所有可能的符号。对于衍生品，如表6上面第页_我对于0、1、2，分别为0.111（3/27）、0.444（12/27）和0.444（12-27）。重要的是，由于三熵必然会计算原始字符串的香农熵，请注意第页_我输入字符串的0,1,2的值是0.333、0.333和0.333，因为它们是等概率的。此外，请注意，只有(n个−1）/2−1衍生物是可能的（其中n个奇数），因为需要三个输入trit来计算导数的每个输出trit。最后，请注意，在双熵中，一旦检测到周期性，进一步的导数就会自动降为0。三熵并非如此，因此，降为0的导数必须有专门的非使用编程。注释n个很奇怪。

TriEn公司 (秒) = (1 / (\sum_{k个 = 0}^{(n个 - 1) / 2} 三^{k个})) (\sum_{k个 = 0}^{(n个 - 1) / 2} (- 第页 (k个) \cdot {日志}_{2} 第页 (k个) - (1 - 第页 (k个)) \cdot {日志}_{2} (1 - 第页 (k个))) \cdot 三^{k个})

(4)

我们展示了表7一个简单的Excel电子表格的布局，用于计算9 trit字符串的多项式（即三次）TriEn。我们使用表7计算导数的每个trit。

我们详尽地计算了所有的TriEnx个< 3⁹并显示生成的自然和三熵素数密度图7。在等效的BiEntropy图中x个< 2¹⁶，BiEntropy几乎是相同的，为了简洁起见，之前省略了它。我们显示了三熵素数密度和自然素数密度之间的差异或Delta图8.

因此x个< 3⁹约为立方。差分的误差近似于高斯分布，如图所示图9平均误差为0.00，标准偏差为7.34。

6.双熵与三熵的相互作用

我们研究了自然数<256时双熵和三熵之间的相互作用。我们根据BiEntropy和TriEntropy为每个自然数分配了两个介于0和15之间（含0和15）的段数。将BiEntropy最低的16个自然数分配给BiEntropy0段，将BiEntopy最高的16个天然数分配给biEntropy15段，以此类推。我们展示了图10下面是蓝色素数和可被6整除的红色素数的出现频率图，这些素数由双熵段数排列在x个轴和上的TriEntropic段编号年轴。素数编码为正数，可被6整除的数编码为负数。第8-9段发生了一次碰撞，对应的数字是42和103，编码为黄色。

虽然数据量很小，但我们从我们早期的实验中预计，增加双熵和增加三熵将揭示更多的素数和更少的复合数。情况似乎就是这样。忽略从左下角到右上角的对角线，左上角的三角形中相对缺少质数（11/120对40/120，第页<0.0001），并且可被六整除的数字在右下三角形中相对不存在（11/120对30/120，第页<0.002），这与先前的预期相对应。只有一个片段发生碰撞，而如果素数和可被6整除的数在所有双熵和三熵片段中的分布是均匀的，则可能会有八个片段发生冲突（54*42/256）。请注意，202个非犯罪均分布在图10，为了简洁起见，不显示这些信息，但可以在补充资料.

7.理论基础

7.1. 介绍

现在我们来说明为什么周期性的概念在决定素性时如此重要。

7.2. 周期数和非周期数

考虑串联的二进制字符串ab公司其中，长度一和b条是n个和n个≥1，则长度ab公司是2n个.如果一=b条对一些人来说n个，那么ab公司是周期性的。周期数出现在从原点发出的对角线上图1（其中n个=4），大多为白色。

7.3. 周期二元素数

在哪里？一=b条=1，其中一些是费马数，其中只有5个已知为素数[25]. 费马数17出现在图1它是紫色的，因为它是上等的。我们在中详细讨论了费马数附录B.

7.4. 周期二元复合物

其余的数字，k个，在从原点发出的对角线上图1及其等价物n个形式如下：

k个= (2^n个∙一) +b条

(5)

自从一=b条
然后

k个= (2^n个+ 1) ∙一

(6)

自从一> 1
因此，k个是复合的。

第一个周期性二元复合物>0为1010，即10（十）。因此，梅森数（形式为2的数^n个长度均匀的−1）（其中a=b)不能是质数。奇长梅森数，例如0111，seven，可能是素数，但不是周期数，因为a≠b。我们列出了周期性二元复合物<256 in附录A并在中详细讨论梅森数附录B.

7.5. N周期二元复合物

表格00111100和10010110等的编号，其中一是的2的补码b条即。，

b条= 2^n个−一− 1

(7)

也是复合材料。这些数字以白色出现在图1这些数字的形式如下：

k个= (2^n个∙一) +b条

(8)

替换

k个= (2^n个∙一) + 2^n个−一− 1

(9)

因此，

k个=一∙ (2^n个− 1) + 2^n个− 1

(10)

k个= (一+ 1) ∙ (2^n个− 1)

(11)

如果一≥1则k个是复合的
其他的一=0和b条是长度的周期性二进制合成（例如1111…）n个/2

7.6. 周期M-Ary素数

所有素数k个>2个是这样的ab公司哪里一和b条长度为n个和a=b=1在一个底座中米=k个− 1.

因为a=b=1
然后

k个= ((k个− 1)¹∙ 1) + 1

(12)

除了费马素数，它们在基2中也是周期性的。

那就是，

k个= (2^{(n个− 1)}·一) +b条哪里一=b条= 1.

(13)

7.7. 周期性M元复合物

一般来说，数字k个，在等价于图1在任何基础上米形式如下：

k个= (米^n个∙一) +b条

(14)

自从一=b条
然后

k个= (米^n个+ 1) ∙一

(15)

自从一> 1,k个是复合的。

7.8. 非周期数字

数字，其中一≠b条(n个≥1）在任何基中都是质数或非质数。

8.讨论

因此，双熵和三熵与素性有任何关系的主要原因是一个简单的事实，除了费马数（例如，23=11₂₂)、定期和n个-周期数不能以任何基数为素数。因此图1（对于所有人x个，并且在所有的基中）几乎没有素数，并且在交叉对角线上没有素数。忽略费马素数，32/256=12.5%的自然数<256不能是素数，因为周期性或n个-最后八个二元导数中七个的周期性。

如果一个二进制字符串是周期的，那么一个，然后所有进一步的导数都降为0[22]. 双熵选择了这一点，因为香农熵为0。对称地，如果一个导数都是1，那么它也会有0香农熵，并且（除非它是最后使用的导数）在下一个导数中都会变成0。周期性观察得越早（即对于较短的周期），加权总数就越低，因为所有较高的权重都为0。非周期字符串以其他方式进行相应排序，其中导数最多的字符串位于或接近第页=0.5，获得最高的BiEntropy。双熵是素性的汉明距离。除非在某些情况下（例如。，秒=0000000 1），二进制导数的位是不可判定的。确定二元导数的位数是暂停问题的简单变体——如果最后一个二元导数是1，则例程会暂停，否则它不会停止。

而字符串是周期性的，当且仅当它的一个导数都是0[22]，反之则不适用，因此素性是随机的。Davies等人[26]证明了如果字符串的位以0.5的概率出现，则导数的位也以0.5的几率出现，并且二进制导数是独立的。因此，由于中心极限定理，二次和双熵素数密度之间的误差是高斯的，双熵素密度是导数每一位出现概率的二次函数。请注意，任何x个是有限的。

通过简单的归纳，每个二进制数都是一个数的二进制导数，它的位以0.5的概率出现。它的钻头已经过验证[26]独立于其早期衍生产品。因此，素数是高斯的，因为它们每一位的出现概率与其他二进制数和其他二进制导数没有差别。

双熵素数密度是平方的，因为双熵是二次的。例如，在8位版本的BiEntropy中，由于字符串都是1，所以任意字符串不是素数的概率，或者二进制导数为0的概率是：

P（P）(秒非素数）=1/256+1/256+2/256+4/256+8/256+16/256+32/256+64/256=128/256=0.5

(16)

即，只有一个8位字符串(秒=d日₀)这都是0，而上次使用的导数d日₆长度为2时，64次均为0d日₅长度为3时，32次都是0。双熵精确测量二进制字符串不能是素数或可能是素数的概率，其精度由d日₀。三熵也是立方的，原因类似。

双熵与素性泛化之间的关系x个原因很简单x个≥256（例如）通过连续二进制微分最终成为8位（例如）字符串。确定所有数据的许多数学和统计特性x个可以通过观察最后的特性归纳得出米二元导数，当米很小。

因此，存在一组常量一_k个,b条_k个、和c（c）_k个，因此

一_k个.x个_k个²+b条_k个.x个_k个+c（c）_k个=锂(x个_k个)其中x个_k个=米²,米是整数，并且c（c）_k个= 0

(17)

和另一组（类似的）常量u个_k个,v（v）_k个、和w个_k个，因此

u个_k个.x个_k个²+v（v）_k个.x个_k个+w个_k个=π(x个_k个)其中x个_k个=米²,米是整数，并且w个_k个= 0

(18)

对于每个一_k个,b条_k个,c（c）_k个和u个_k个,v（v）_k个、和w个_k个，存在一组(米²−米)/二元导数，素数的分布是以已知的概率和可计算或可估计的方差导出的。自然素数密度的方差受到所有双熵素数密度方差的约束x个_k个<x个因为相同的数据——自然数——是高斯分布在两个不同的中心测度上——二次被积函数和对数被积函数。

自

林π(x个)/锂(x个) ~ 1
x个→∞

(19)

因此，在极限条件下，双熵/二次和对数积分/自然误差分布与几乎相同的误差分布一致，我们在图3此外，作为x个→∞, 由于二进制导数中的位数=(米²−米)/2，其中米=对数₂(x个)，双熵素数密度和二次素数密度之间的误差方差为O（运行）（日志(x个)/x个)由于中心极限定理。因此，对数积分和自然素数密度之间的误差迅速趋于0。

即Lim Var(π(x个) −锂(x个)) → 0
x个→∞

(20)

这与von Koch明显不同[27]注定要证明黎曼假设。

π(x个) −锂(x个) =O（运行）(√x个日志(x个))

(21)

一组类似的立方常数适用于三熵以及双熵和三熵的算术加法，我们将其表示为三双熵。我们举例说明了三重熵相交的立方π(x个)用于各种x个在里面图11.

9.结论

我们已经证明了自然数的双熵和素性之间存在明显的经验联系⁸.我们在统计上对<2的自然数重复了此分析³²发现了类似的结果，包括剩余的素密度O（运行）(x个²). 我们开发了一个相关的三熵函数，并表明三熵将质密度改变为O（运行）(x个^三)对于<3的自然数⁹此外，三熵解决了双熵函数中检测长度为3或其倍数的周期时的一个天然弱点。

由于双熵和三熵只是字符串有序性和无序性（即周期性）的度量，这意味着以二进制或三进制表示的素数具有更多无序表示。相反的含义是复合材料具有更有序的表示。这一结果已在算法信息理论的早期工作中提出。

我们已经展示了如何通过在双熵计算中增加香农熵的指数来提高双熵的灵敏度。我们已经证明了自然数中的双熵和三熵之间的重要联系⁸以及通过算术加法将双熵和三熵结合起来的实用性。我们简要概述了这项初始实验工作背后的理论基础，并说明了它是如何推广到所有自然数的。

我们已经展示了误差的方差π(x个)以及锂(x个)由于方差的高斯约束，趋向于0π(x个)由二元导数施加。这些约束比Von Koch在1901年证明的等价于黎曼假说的边界要严格得多。

我们提供了附录B费马素数和梅森素数的绝对收敛渐近线。

最后，由于二元导数导致素数的分布是高斯的，这意味着孪生素数猜想是正确的。

10.进一步工作

来自的注释图1以及早期的工作，即双熵、三熵等，尽管实是量子化的，不连续的，并且具有有限数量的状态。这可能与将双熵和三熵与物理域关联的尝试有关[28].

有无数机会将首要性与其他领域联系起来[29]特别是要记住二进制、二进制导数、素性及其米-抽象概括。

11.专利

双熵函数在Gurieri，T.M.，Hamlet，J.R.，Bauer，T.M..，Helinski，R.，&Pierson，L.G.（2018）《美国集成电路物理不可测函数专利》（美国专利号10103733）中有突出引用[10]

补充资料

用于执行本文蒙特卡罗模拟、计算、表格和图形的全套电子表格可在Figshare Data Depository中找到：Croll，Grenville（2020），BiEntropy_TriEntropy_and_Primality.zip。无花果。数据集。https://doi.org/10.6084/m9图11743749.

基金

这项研究是自筹资金的。

致谢

作者感谢妻子的支持，并为2019年1月至2020年1月的这项工作提供部分资金。作者感谢ANPA、PANPA和EuSpRIG的同事们的建议、贡献、陪伴和支持。作者感谢他的家人和朋友，因为他们很幽默地容忍了他频繁的数学独白。作者感谢匿名推荐人的评论。

利益冲突

没有利益冲突需要申报。

附录A：周期性二元复合物<256

形式的周期二进制数ab公司哪里一=b条≠1不可能是素数。

表A1。周期二元复合物<256。

位	二元的	十进制的	双熵
4	1010	10	0.14
4	1111	15	0
6	10010	18	0.44
6	11011	27	0.95
8	100010	34	0.05
6	100100	36	0.95
6	101101	45	0.44
8	110011	51	0.02
6	110110	54	0.95
6	111111	63	0
8	1000100	68	0.05
8	1010101	85	0.01
8	1100110	102	0.02
8	1110111	119	0.05
8	10001000	136	0.05
8	10011001	153	0.02
8	10101010	170	0.01
8	10111011	187	0.05
8	11001100	204	0.02
8	11011101	221	0.05
8	11101110	238	0.05
8	11111111	255	0

附录B.费马和梅森素数

费马数的形式为2^{2 ^n个}+ 1. 费马数也是形式的周期二进制数ab公司哪里一=b条= 1. 我们展示了表A2已知的五个费马素数。

表A2。费马素数。

费马数	十进制的	二元的	n个
F类₀	三	11	1
F类₁	5	0101	2
F类₂	17	00010001	4
F类_三	257	0000000100000001	8
F类₄	65537	00000000000000010000000000000001	16

1896年Jacques Hadamard和Charles de la ValléePoussin的素数定理推断，对于二进制字符串x个长度为2n个比特，概率，第页，它的素数是~1/log（2^2个). 有2个^2个长度为2的二进制字符串n个，只有一个可以是周期长度的周期二元素数n个哪里一=b条= 1.

因此，长度为2的二进制字符串n个是一个黄金时段n个是

第页（F）_n个=素数）=1/log（2^2n个+ 1)

（A1）

注意，素数定理的渐近线表示偶数和不可能是素数的周期数。因为周期性和潜在素性是每个长度为2的字符串的独立函数n个，可能的费马素数总数：

{F类}_{\infty} = \sum_{n个 = 1}^{n个 = \infty} (1 / 日志 (2^{2 n个} + 1))

（A2）

通过考试表A3和图A1收敛到约5比2n个< 2¹⁰²⁴（电子表格浮点极限），并根据D’Alembert准则绝对收敛。

图A1。实际和预期费马质数。

通过对数近似对级数进行延拓，可以发现3226项可能为第6个费马素数，13651项可能为7个费马素数。然而，已经表明，对于形式2的数字^k个+1是质数，k个是二的幂。作为[25]讨论中，尽管这种对数近似仍在继续，但进一步费马素数的可能性很小。

表A3。实际和预期费马质数。

N个	2^2个	2^n个+1	单位：ln（2n）	∑第页（F）(n个))	F类	达朗伯特准则
1	4	三	0.6213	0.6213	1
2	16	5	0.3530	0.9743	2	0.5681
三	64	9	0.2396	1.2138	2	0.6787
4	256	17	0.1802	1.3941	三	0.7523
5	1024	33	0.1442	1.5383	三	0.8004
6	4096	65	0.1202	1.6585	三	0.8334
7	16384	129	0.1030	1.7616	三	0.8572
8	65536	257	0.0902	1.8517	4	0.8750
9	262144	513	0.0801	1.9319	4	0.8889
10	1048576	1025	0.0721	2.0040	4	0.9000
11	4194304	2049	0.0656	2.0696	4	0.9091
12	16777216	4097	0.0601	2.1297	4	0.9167
13	67108864	8193	0.0555	2.1852	4	0.9231
14	268435456	16385	0.0515	2.2367	4	0.9286
15	1073741824	32769	0.0481	2.2848	4	0.9333
16	4294967296	65537	0.0451	2.3299	5	0.9375
17	17179869184	131073	0.0424	2.3723	5	0.9412
18	68719476736	262145	0.0401	2.4124	5	0.9444
19	2.74878E11型	524289	0.0380	2.4504	5	0.9474
20	1.09951E12号机组	1048577	0.0361	2.4864	5	0.9500

类似的论点也适用于梅森素数，只是有两个术语可以解释01111111和11111111形式的数字。素数定理并不“知道”偶数周期数不可能是素数。级数再次绝对收敛，但收敛速度慢得多，我们在中进行了说明图A2因此，梅森素数的总数为：

{M（M）}_{\infty} = \sum_{n个 = 1}^{n个 = \infty} 1 / 日志 (2^{(2 n个 - 1)} - 1) + 1 / 日志 (2^{(2 n个 - 2)} - 1)

（A3）

图A2。实际和预期梅森素数。

目前已知的梅森素数有51个，2个^82,589,933-1是截至2019年10月最大的[30]. M的进一步评估_∞渐近线将需要对上述公式进行对数变换，并使用更合适的软件。

工具书类

Croll，G.J.BiEntropy-有限二进制字符串的近似熵。arXiv公司 2013，arXiv:1305.0954。[谷歌学者]
哈代，G.H。；E.M.赖特。数论导论; 牛津大学出版社：英国牛津，1979年。[谷歌学者]
Croll，G.J.《简单立方晶格上结的双熵》。在统一场论II：公式和经验测试——第X届法国数学物理学家Jean-Pierre Vigier学术研讨会论文集; 世界科学：新加坡，2018年。[谷歌学者]
科斯塔·R。；Boccardo，D。；Pirmez，L。；Rust，L.F.隐藏嵌入式系统的密码密钥。高级信息科学。计算。工程师。 2015。在线提供：http://www.wseas.us/e-library/conferences/2015/Dubai/CEA/CEA-42.pdf（2020年3月5日查阅）。
金·R。；Zeng，K.信号注入攻击下的物理层密钥协议。2015年IEEE通信与网络安全会议（CNS）会议记录，意大利佛罗伦萨，2015年9月28日至30日；第254-262页。[谷歌学者]
金·R。；Shi，L。；曾，K。；潘德，A。；Mohapatra，P.MagPairing：使用磁强计近距离配对智能手机。IEEE传输。Inf.法医安全。 2016,11, 1306–1320. [谷歌学者] [交叉参考]
科特，V。；Molata，V。；Jakovenko，J.真随机数生成器安全增加的增强通用体系结构。验电器 2014。在线提供：https://otik.uk.zcu.cz/bitstream/11025/1185/1/Kote.pdf（2020年3月5日查阅）。
Stakhanova，N.基于熵的加密流量分类器。《信息和通信安全：第17届国际会议论文集》，ICICS 2015，中国北京，2016年12月9-11日。[谷歌学者]
赫林斯基，R。Python 1.0版的BiEntropy（编号：BiEntropy1.0；005634MLTPL00）; 桑迪亚国家实验室：美国新墨西哥州阿尔伯克基，2018年。
T.M.Gurieri。；哈姆雷特，J.R。；T.M.鲍尔。；Helinski，R。；Pierson，L.G.美国集成电路物理不可克隆功能专利。美国专利101037332018年10月16日。[谷歌学者]
克兰德尔，R。；Pomerance，C。素数：计算的观点; 施普林格：德国柏林/海德堡，2005年。[谷歌学者]
盖伊，R。数论中尚未解决的问题; 施普林格：德国柏林/海德堡，2004年。[谷歌学者]
拉西亚斯，M。数论中的问题解决和选题; 施普林格：德国柏林/海德堡，2011年。[谷歌学者]
米勒，S。；Takloo-Bighash，R。现代数论邀请函; 普林斯顿大学出版社：美国新泽西州普林斯顿，2006年。[谷歌学者]
小纳什·J.F。；马萨诸塞州拉西亚斯。数学开放题; 施普林格：德国柏林/海德堡，2016年。[谷歌学者]
G.J.Croll，电子表格在伦敦市的重要性和关键性。arXiv公司 2007，arXiv:0709.4063。[谷歌学者]
Grossman，T.A.电子表格工程：研究框架。arXiv公司 2007，arXiv:0711.0538。[谷歌学者]
Grossman，T.A.电子表格分析入门。arXiv公司 2008，电话：0809.3586。[谷歌学者]
塞尔诺奇，M。；Biró，P.《Sprego中的问题解决》。arXiv公司 2016，arXiv:1603.02262。[谷歌学者]
塞尔诺奇，M。；Biró，P.教育版电子表格能力框架。arXiv公司 2018，arXiv:1802.00496。[谷歌学者]
香农，C.E.传播数学理论。贝尔系统。技术J。 1948,27, 379–423. [谷歌学者] [交叉参考] [绿色版本]
Nathanson，M.B.二元序列的导数。SIAM J.应用。数学。 1971,21, 407–412. [谷歌学者] [交叉参考]
Goka，T.二元序列上的算子。SIAM版本。 1970,12, 264–266. [谷歌学者] [交叉参考]
Chaitin，G.J。；Schwartz，J.T.关于蒙特卡罗素性测试和算法信息理论的注释。巴普。算法基础理论 1990,8, 197. [谷歌学者]
博克兰，K.D。；康威，J.H.预计最多会有十亿分之一的新费马素数！arXiv公司 2016，arXiv:1605.01371。[谷歌学者] [交叉参考] [绿色版本]
戴维斯，N。；道森，E。；古斯塔夫森，H。；Pettitt，A.N.使用二进制导数测试流密码中的随机性。统计计算。 1995,5, 307–310. [谷歌学者] [交叉参考]
von Koch，H.Ueber die Riemann的che Primzahl函数。数学。安。 1901,55, 441–464. [谷歌学者] [交叉参考]
Croll，G.J.双熵——有限二进制字符串中有序与无序的度量和代数。在纪念H Pierre Noyes 90岁生日的科学论文; 《世界科学：新加坡》，2014年。[谷歌学者]
Guariglia，E.素性、分形和图像分析。熵 2019,21, 304. [谷歌学者] [交叉参考] [绿色版本]
P.GIMPS拉罗什。在线提供：https://www.mersenne.org/primes/press/M82589933.html（2020年3月5日查阅）。

图1。自然数<256的双熵和素性。

图2。双熵修正素数密度。

图3。素密度变化。

图4。将香农熵提高到更高的幂。

图5。P10双熵和素密度。

图6。P10双熵和素密度增量。

图7。三熵和素密度。

图8。三熵和素密度增量。

图9。三熵增量/立方误差。

图10。双熵和三熵相互作用<256。

图11。双熵+三熵和π(x个)用于各种x个<16k。

表1。主要比例。

颜色代码	双熵	计数	Prime（主要）	主要比例
白色	<0.15	32	1	0.0312
黄色的	<0.25	32	1	0.0312
橙色	<0.50	64	15	0.2343
红色	<1.00	128	37	0.2890

表2。平均双熵。

	Prime（主要）	非Prime	奇数	梅森	双胞胎
平均值	0.7897	0.5863	0.5099	0.8134	0.7783
S.开发	0.2505	0.3444	0.3497	0.2443	0.2674
N个	54	202	75	4	33

表3。双熵有序素数段。

细分市场	双熵≤	底漆
1	0.1141	1
2	0.2395	1
三	0.4558	8
4	0.4734	6
5	0.9350	6
6	0.9487	9
7	0.9506	9
8	0.9532	14

表4。π（x）和各种x的二元导数的个数。

x个	比特(米)	π（x）	衍生品(d日)	d日/π(x个)%
256	8	54	28	51.85%
65536	16	6542	120	1.83%
4,294,967,296	32	203,280,221	496	0.00%

表5。两两三元加法表。

	0	1	2
0	0	1	2
1	1	0	1
2	2	1	0

表6。两两三元差（PTD）表。

一	B类	C类	PTD公司	三熵
0	0	0	0	0.168
0	0	1	2	0.395
0	0	2	1	0.395
0	1	0	2	0.395
0	1	1	2	0.395
0	1	2	1	0.395
0	2	0	1	0.395
0	2	1	1	0.395
0	2	2	1	0.395
1	0	0	2	0.395
1	0	1	2	0.395
1	0	2	1	0.395
1	1	0	2	0.395
1	1	1	0	0.168
1	1	2	2	0.395
1	2	0	1	0.395
1	2	1	2	0.395
1	2	2	2	0.395
2	0	0	1	0.395
2	0	1	1	0.395
2	0	2	1	0.395
2	1	0	1	0.395
2	1	1	2	0.395
2	1	2	2	0.395
2	2	0	1	0.395
2	2	1	2	0.395
2	2	2	0	0.168

表7。计算9-Trit三熵。

N的三元展开	长度（N）	编号0	N1型	氮气	第页	1−p	−p.log（p）	−（1−p）.log（1–p）	TriEn公司	k个	3平方公里	三位数3^k
111201101	9	2	6	1	0.33	0.67	0.53	0.39	0.92	0	1	0.92
0211222	7	1	2	4	0.40	0.60	0.53	0.44	0.97	1	三	2.91
12220	5	1	1	三	0.38	0.62	0.53	0.43	0.96	2	9	8.61
201	三	1	1	1	0.33	0.67	0.53	0.39	0.92	三	27	24.79
									3.76	6	40	37.23
									三叉戟（s）			0.93

分享和引用

MDPI和ACS样式

G.J.克罗尔。双熵、三熵和素数。熵 2020,22, 311.https://doi.org/10.3390/e22030311

AMA风格

Croll GJ公司。双熵、三熵和素数。熵. 2020; 22(3):311.https://doi.org/10.3390/e22030311

芝加哥/图拉宾风格

格伦维尔·J·克罗尔。2020年，“双熵、三熵和素数”熵第22页，第3:311页。https://doi.org/10.3390/e22030311

请注意，从2016年第一期开始，该杂志使用文章编号而不是页码。请参阅更多详细信息在这里.

文章菜单