科学工作

科学工作
对科学和数学的信任

Ubiquity，第2022卷，2022年6月、6月发行 |作者：Jeffrey Johnson，Andrew Odlyzko

ACM数字图书馆的完整引用 | PDF格式

无处不在

第2022卷，6月号（2022），第1-9页

普及研讨会：科学的工作：对科学和数学的信任
杰弗里·约翰逊、安德鲁·奥德利兹科
内政部：10.1145/3512337

对科学可信度的担忧并不局限于那些完全拒绝科学的边缘群体。即使在研究人员中，也对同行评审的可靠性和再现性危机感到相当不安，因为科学结果没有或不能通过复制来测试。在这里，作者指出，这种担忧甚至适用于数学——对于许多科学语言来说。这在很大程度上是由于我们的知识库越来越复杂，其中的结果更加复杂，调查人员有时不得不依赖他们不完全理解的其他人的结果。这意味着，与科学一样，数学发现越来越必须被视为不绝对可靠的，而是寻找真理，甚至是寻找真理的过程的一部分。

科学在人们生活中的重要性与日俱增。然而，人们对科学的信任似乎正在减少。由于科学被用于支持政策，这场全球流行病使科学的可信度问题成为人们关注的焦点。大多数公众对科学家们对耗资数十亿美元和数百万人生命的政策可能产生的结果缺乏共识感到困惑。

这种担忧在很大程度上可以被忽视，因为人们对科学是什么以及它是如何工作的缺乏了解。当然，很多是出于政治动机，基于不愿意接受不方便的调查结果。然而，内部趋势（主要是日益复杂的趋势）引发了关于科学可信度的严重问题，这些问题应该面对。在本文中，我们指出，即使是数学，科学的语言，以及整个科学大厦所依赖的学科，其可靠性也受到越来越多的质疑。

我们的结论不是科学和数学不值得信任。相反，需要强调的是，科学和数学研究是一个过程，通常不会产生绝对真理。有自我修正的因素在起作用，人类肯定能够从进一步的研究进展中受益。然而，不应忘记的是，一个人需要保持一定程度的怀疑，可能对所有结果的怀疑程度越来越高，即使是广泛接受的同行评议文献中的结果。

科学与社会

尽管有一些怀疑论者，如反瓦克斯主义者、否认气候变化者和许多其他人，但大多数人在很大程度上相信科学及其在社会政策中的应用。例如，截至2021年9月，近90%的英国成年人至少注射过一次Covid-19疫苗[1]. 然而，应用科学并非十全十美，偶尔也会导致可怕的错误，例如20世纪50年代和60年代的沙利度胺悲剧，当时数千名婴儿在几个月内死亡，或出生时四肢缺失或畸形。非专业人士没有接受过判断医学试验证据的培训，也没有信任监管机构来保护他们。在美国，食品和药物管理局没有批准沙利度胺，但在其他46个国家，监管机构没有批准其公民[2]. 这表明，政策制定者对科学应用的担忧并非完全被误导。

科学界有决定其理论有效性的协议。所有科学理论都是偶然的——它们不能被证明是正确的，但如果与观察结果不一致，就必须加以修改或拒绝。金标准是利用理论进行预测，进行可复制的实验，并表明每次进行实验时数据都支持预测。然而，在一个复杂的世界中，这些协议可能很难或不可能应用，科学内部也有响亮的声音质疑同行评审文献中公布甚至发表的许多内容的有效性。

彻头彻尾的欺诈一直是科学界的一个问题，有人声称，随着出版、获得资助等压力的不断增加，欺诈行为也在增加。但这一问题的严重程度远低于“复制危机”。这指的是一些在文论中出现多年或几十年后才最终被驳斥的结果。出现这个问题的部分原因是，研究人员很少有动机从事非原创工作，即检查他人的工作。在越来越大的程度上，这也源于实际不可能复制原始研究。你如何验证一个基本粒子的发现？这个发现是通过对来自世界上唯一一个能够产生数据的加速器的巨大数据集进行大规模计算发现的？您如何验证网络科学的结果，该结果来自对由于专有或隐私原因而无法公开获取的巨大数据集的复杂分析？因此，即使是同行评议的科学文献，其基础也越来越不稳固。例如，一项对大量杰出心理学结果的研究发现，尽管使用了原始作者提供的材料，但大部分复制结果对原始发现的证据较弱[3]. 类似的问题在数学中越来越明显。

数学及其与科学的关系

数学不是一门经验科学，尽管它的大部分灵感来自经验事实，无论是来自各种科学还是来自对数学概念的探索。它是科学的语言，但在很大程度上是一门演绎学科。大多数数学家都是柏拉图主义者，这意味着他们并不声称自己在研究中正在构建新的东西。相反，他们认为他们正在发现独立存在的潜在数学结构。在这方面，他们与大多数科学家相似。

数学以其所达到的严谨程度而自豪。尽管如此谨慎，但这种严苛从来都不是绝对的。历史提供了许多错误结果的案例，这些错误结果在发现其证明中的缺陷之前被广泛接受，以及在被证明是正确之前被视为错误的证明。然而，总的来说，专业数学家对他们同行评议的文献的可靠性普遍感到有信心。但这种严格性似乎越来越令人怀疑。这与数学知识的基本基础问题不同。

数学基础

数学中有一些非常基本的问题，在一定程度上动摇了实践者对其领域内在美和简单性的信念。例如，20世纪30年代哥德尔的不完备性定理表明，在满足某些自然属性的任何公理系统中，都存在无法证明为真的“真”语句。这意味着我们不能指望证明一切；每一个非平凡逻辑系统都会包含一些命题，这些命题是“不可判定”的命题，在系统中无法证明是真是假。这意味着希尔伯特在1930年表达的“我们必须知道，我们会知道”的伟大愿望无法实现。

在哥德尔20世纪30年代不完全性定理遭受地震冲击之前的几十年，数学中已经出现了一些分歧，例如，直觉主义者的出现，他们想要一种更具建设性的数学方法。特别是，他们希望避免排除中间律，这是传统逻辑的基本原则之一，它规定每个命题，要么该命题，要么其否定为真。然而，直觉主义的方法并没有被广泛接受，直到哥德尔的结果出现，大多数数学家才不得不承认他们的领域存在严重的基础性问题。

其他一些结果，如选择公理的独立性，或一般的建构性问题，也打乱了数学家们对一座理智上干净的大厦的希望。尽管这些现象令人失望，但它们并没有严重破坏人们对已发表文献可靠性的信心。对于证明的严格性，有公认的标准，出版前有同行审查制度。此外，与大多数领域不同的是，数学有专门的期刊，由公认的专家评审最近发表的论文。这为数学家和其他领域的专家提供了额外的审查层，从而使他们更加确信所发表的内容是可信的。

数学与“书”

数学面临的主要问题是，它的文献正在偏离理想，在理想中，个人可以确信他们可以信任他们阅读或发表的结果。这可以通过参考伟大的多产、古怪和巡回数学家保罗·埃尔德（1913-1966）的概念来说明。埃尔德经常会在未经宣布的情况下出现在一位数学家同伴的门口，宣称“我的大脑是开放的！”，只要他的同事提出有趣的数学挑战，他就会留下来。这本书是一本由上帝（厄尔德称之为“最高法西斯”）保存的假设性的数学定理证明集，具有尽可能简单和优雅的特点。Erdős能对同事的工作给予的最高赞扬是说“这是从书中直接得出的”[4]. 这本书的思想已经被许多数学家所接受，对于哪些证据符合或不符合这本书，存在争议。两位杰出的研究人员在许多其他人的投入下，挑选出的一本书已经过了六个版本[5].

什么样的校样适合这本书？有不同的意见，但似乎每个人都同意有必要包括欧几里德的证明，素数序列没有结束。艾格纳和齐格勒的证明书中的证据大致如下：

对于任何有限集{对₁，…，p_第页}考虑素数

n个=对₁对₂…p_第页+ 1.

然后要么n个有一个素除数对小于n个，或n个是素数第页。但是对不是对_我：否则对将是1的除数，即n个和产品对₁对₂…第页_第页，这是不可能的。所以一个有限集{对₁，…，p_第页}不能是所有质数的集合[5].

这也表明了素数的数量一定是无限的。这个论证很简单，不需要任何深厚的数学背景知识，并且其正确性不容怀疑。

在他1940年的书中数学家的道歉哈代指出，欧几里德的证明是通过反证法进行的。具体如下。假设我们想证明对是真的，我们已经知道了q个是真的。然后假设，与我们想要证明的相反，我们假设对并以此证明非p暗示无-q因为，根据假设，q个是真的，这是一个荒谬的矛盾，从中可以得出结论对必须为真。哈代继续说道：“欧几里德非常喜欢的荒诞还原法是数学家最好的武器之一。这是一种比任何国际象棋棋都精细得多的赌博：棋手可以牺牲棋子，甚至一块棋子，但数学家可以提供游戏。”[6].

哈代指出：“可以安排欧几里德的证明，以避免简化和荒谬，一些学派的逻辑学家更喜欢这样。”这将包括追随1907年L.E.J.Brouwer工作的直觉主义数学家。直觉主义逻辑可以简洁地描述为经典逻辑，没有亚里士多德的排中律，对或非p; 或者经典的双重否定消除法则，不-(非p)暗示对[7]. 直觉主义者要求建立数学对象，而不满足于说数学对象存在的论点，因为如果不存在，就会导致矛盾。

数学及其增长复杂性

哈迪的论点表明，有时可以调和《圣经》所要求的简单性和直觉主义等哲学所要求的对允许的论点范围的特殊限制。但这是罕见的。

现代数学研究很少产生符合本书要求的结果。不仅要做研究和撰写论文，而且要理解结果，就越来越需要深奥的知识。日益成熟的技术以及对几个主题专业知识的需求，导致了在其他领域也出现了一种现象，即更多的合作。一个世纪前，95%以上的数学论文是由单一作者撰写的，而今天只有不到一半是由单一作者撰写的。当然，这意味着作者往往不能完全理解他们所写的每一件事。而且同行评审很难对论文做出可信的评价。在某些情况下，声称的著名结果的解决方案会流传数年，而对其正确性却没有定论[8].

这些因素影响了许多现代数学文献。我们没有关于已发表论文的错误程度的定量数据，但有轶事证据，包括编辑的评论，即很难获得详细的裁判报告。

我们的论点与博尔奇的论点有很多共同之处[9]. 然而，我们并不认为正在发生的事情是一场危机。这似乎是一种长期发展趋势的延续和强化。

我们所能做的是通过讨论一些著名的数学问题来说明诚信的一些关键问题，这些问题的解决方案已经引起了对其有效性的争议。一个突出的例子是四色猜想[10]. 20世纪70年代中期，在计算机的关键帮助下，阿佩尔和哈肯证明了这一点。证明的基本过程并不十分复杂，但有许多特殊情况需要考虑。这些可以用简单的算法构建，并由计算机完成。原则上，他们可以手工完成，但案件数量太多，不切实际。这导致了关于证据是否可以被接受为有效证据的大量辩论。

从那时起，四色定理的证明得到了改进。基本分析更简单、更容易理解，并且需要计算机检查的案例数量更少。因此，它被普遍认为是有效的，这既是因为现在有独立的证据，也是因为计算机的使用普遍变得更加广泛和普及。但在数学中仍然存在一些不安，因为目前已知的四色定理的证明并没有被认为接近于该书的资格。它们都需要处理许多特殊情况。

四色问题的早期历史说明了数学真理的社会本质。1879年，阿尔弗雷德·坎佩给出了一个广为接受的证据。11年来，数学界的共识是这个猜想被证明是正确的。然而，1890年，珀西·海伍德（Percy Heawood）证明了肯佩（Kempe）的证明是错误的[10]. 因此，11年来，数学界一直认为这个猜想是正确的，但后来又恢复到“未经证明”的状态。对于一些数学家来说，在Appel和Haken 1976年的计算机证明之后，这个猜想又变回了正确的状态，但对于其他人来说，它并不是这样。1993年6月，安德鲁·怀尔斯（Andrew Wiles）对费马最后一个定理的证明从“未经证明”转变为“已证明”，引起了极大的兴奋。不幸的是，在1993年9月发现证据有误后，它又回到了未经证实的状态。1994年，怀尔斯和泰勒的灵感使怀尔斯在1995年发表了一个令数学界满意的证明，而这个猜想又回到了今天的状态。在科学中，一个理论被接受，直到有证据拒绝它；在数学中，除非数学家团体投票反对，否则证明似乎是有效或无效的。正确的证据是社会建构的观点与柏拉图的理想相去甚远。

四色定理证明的可信度问题取决于计算机的使用，并且在某些人心中仍然存在。但是，即使在计算机发挥次要作用的某些情况下，也会出现类似的问题。在Appel和Haken证明四色定理后不久，有限单群的分类于20世纪80年代初宣布。这是在数学中一个重要的基础问题上取得的重大成就。但在某些方面，这甚至更具争议性——不是因为对计算机的依赖，而是因为结果依赖于数百名数学家的工作，以一种松散协调的方式工作。这是数学合作的里程碑，始于互联网普及之前。但这项工作的成果是收集了一些估计超过15000页的论文，其中有不少已知或怀疑存在非平凡的空白。（1983年的胜利宣言中也忽略了一个很大的差距，即缺乏对特定群体的治疗，但我们忽略了这一点。）那么，这真的是一个证据吗？它一直受到一些怀疑，有几篇论文，例如在算法分析中，明确指出只有当有限简单群的分类是正确的时，它们才是有效的。

目前正在努力简化原始证据，使其更加准确可靠。但即使是这家企业也已经出版了5000多页的书籍和论文。这可能是完全正确的吗？许多专家更愿意使用一个相对简单的计算机程序来检查数十亿个案例，而不是依赖于5000页由人生成的文本。

与四色定理和有限简单群的分类相关的争议基本上是相同的，即，我们怎么能相信那些极为复杂且超出任何人的完全理解的论点，无论多么天才？当然，有希望找到更简单的证明，但希望渺茫。目前，我们要么依赖长时间的计算机计算，要么依赖具有人类弱点的人类研究人员的劳动。

一种增加我们对复杂论点的信任的方法是，最近对有四个世纪历史的开普勒猜想所做的工作，该猜想是关于三维中等量球体的最密集堆积[11]. 在之前的一些尝试失败后，Hales于1998年提出了一个被专家普遍接受的论点。与四色定理一样，它依赖于大量的计算机计算，人们对其有效性仍有疑问。这使得Hales与合作者一起获得了证明有效性的正式证据（或者更准确地说，是重新编写的证明版本，以便由证明助理进行检查）。当然，这并没有消除所有的疑虑，因为人们必须承认自动定理证明器是正确的，运行它们的软件和硬件是按照规范运行的，没有宇宙射线在内存中翻转位等等。此外，还有一些严重的疑虑，例如在De Millo等人[12]在程序正式验证的背景下，但对于此类方法的有效性，适用范围更广。

结论

展望未来，计算机硬件和软件正在变得更好，因此我们可以希望形式化方法方法，例如用于开普勒猜想的方法，可以帮助处理其他复杂的数学证明，甚至可以帮助处理有限简单群的分类。但肯定会有问题。首先，这些正式系统是否可信？第二，它们会在足够的情况下应用吗？就软件而言，实际部署系统的复杂性超过了正式验证的能力。

所以，有很多方法可以提高数学文献的可信度。但它们的有效性还有待观察，与此同时，数学与大多数领域一样，正遭受着日益增长的复杂性，越来越少的数学符合《Boo》的要求。

数学继续发展，并且仍然是发现新结构和关系的充满活力和想象力的源泉。它继续在各个领域找到有价值的应用。甚至非常抽象的结果也被用于从生物信息学到机器人学的各个领域。但我们需要认识到，就像对待科学一样，即使是在最负盛名的期刊上发表的数学，也不能被视为确定的真理，而应被视为寻找真理的持续过程的一部分。我们应该做好准备，在前进的道路上遇到一些失误。

致谢

作者感谢Robert Akscyn、Joe Buhler、Peter Denning、Dennis Hejhal、Jeffrey Lagarias、Ted Lewis、Peter Olver和Philip Yaffe的评论。

工具书类

[1] 视觉和数据新闻团队。冠状病毒疫苗：到目前为止，英国有多少人接种了疫苗？BBC新闻。2021年9月30日。

[2] 科学博物馆。沙利度胺2019年12月11日。

[3] 开放科学合作。评估心理科学的再现性.科学类349. 6251 (2015). DOI:10.1126/science.aac4716。

[4] 大英百科全书。保罗·埃尔德斯：匈牙利数学家.

[5] Aigner，M.和Ziegler，G.M。书中的证据，第6版。施普林格出版社，2018年。

[6] 哈代·G·H·。，数学家的道歉剑桥大学出版社，1990年。（1940年首次出版）。

[7] 斯坦福哲学百科全书。直觉主义逻辑.首次出版于1999年9月1日星期三；实质性修订2018年9月4日星期二；https://plato.stanford.edu/entries/logic-infirationistic（柏拉图·斯坦福德ed.edu）/

[8] K·哈特内特。新数学书拯救了地标性拓扑证明.Quanta杂志2021年9月9日。

[9] 博尔奇，A。数学中的复制危机？ 数学信使43 (2021) 48-52.

[10] R.威尔逊。四色足够：地图问题是如何解决的第二版，普林斯顿大学出版社，普林斯顿，2014年。

[11] Lagarias，J.C.编辑。开普勒猜想。Hales-Ferguson证明纽约施普林格出版社，2011年。

[12] De Millo，R.A.、Lipton，R.J.和Perlis，A.J。定理和程序的社会过程和证明ACM通讯22，5（1979），271-280。

作者

杰夫·约翰逊（Jeff Johnson），开放大学复杂性科学与设计教授，在剑桥大学地理系担任三年高级研究员，在埃塞克斯大学数学系担任六年研究员后，于1980年加入该大学。他是设计、开发、环境和材料系主任，也是复杂系统协会主席。

Andrew Odlyzko在贝尔实验室、美国电话电报公司实验室以及最近在明尼苏达大学的研究和研究管理领域有着长期的职业生涯，他在那里建立了一个跨学科研究中心，现在是数学学院的教授。他曾在数学、计算和通信等多个领域工作，专注于技术创新的传播。他的最新作品可以通过他的网页获得。

2022版权归所有者/作者所有。

文章

科学工作对科学和数学的信任

科学工作
对科学和数学的信任