ACM的人-马修·罗汉

2019年2月26日

你写了很多关于互联网流量矩阵.我们对流量矩阵的理解的最新发展将在未来几年影响网络测量研究?

流量矩阵是网络管理的一个重要组成部分,无论是为了效率还是可靠性,我一直喜欢研究能够产生实际影响的主题。但是,最初让我陷入与测量和实际应用相关的领域问题的大多数问题现在都得到了解决。最近我感兴趣的主题是如何合成人工流量矩阵。

我们没有很多好的(公共)互联网流量矩阵数据集,即使我们有更多的数据,它们都是高维数据,所以我们永远不会有足够的数据。合成是处理矩阵的一种方法,而不需要大量的测量。当然,合成矩阵必须生活在一个丰富而有趣的空间中,而生成这是一个挑战。最近,我对使用最大熵感到兴奋。这是一种很好的技术,因为它允许您根据所知对模型施加条件或约束(例如,流量不能为负)。然而,真正好的部分是它概括了拉普拉斯的无差别原则(有时归因于雅各布·伯努利),这是离散概率的基础,也是贝叶斯统计的基础。这是一个原理,除非你知道得更好,否则假设投掷硬币正面朝上的概率是一半,而标准骰子掷6的概率是六分之一。

最大熵将无差别原则带到了下一个层次,这样做可以让你在不依赖任何其他(隐藏的)假设的模型中使用你所拥有的数据(例如,关于硬币偏差的数据)。在建模时,这是一个很好的属性。但它也有吸引力,因为它与信息理论(我们用于估计交通矩阵)和关于复杂性的想法联系在一起,我真的想进一步探索。

在最近的一次演讲中,你说好的数学抽象将是未来几年网络安全工作的重要工具。你能解释一下吗?

这是一个至关重要的话题。目前,太多的网络安全工作都是通过临时和被动修复来实现的。通常,对一个问题的修复会无意中创建一系列新漏洞。例如,如果我们查看CVE(Common Vulnerability and Exploit)数据库,就会发现这方面的证据。我们可以看到,近年来问题数量急剧增加。应对网络安全的被动方法正在失败。

越来越多的人试图解决这个问题。它们的范围从DARPA大挑战几年前,为了使用人工智能,为了基于过程的方法。但对我来说,在我们讨论安全“如何操作”之前,最基本的问题是“我的安全策略是什么?”?

这些问题不应该依赖于细节。当我告诉你我的安全策略时,我不应该告诉你我拥有的设备类型或操作系统。我应该能够用“抽象”的术语来描述它,这样我就可以将具体细节与我真正关心的方面分开。这样,我就可以在不更改策略的情况下更改底层技术实现,这样,我的网络就可以灵活地增长和适应,而无需更改高级安全策略。更重要的是,通过良好的抽象,我可以对政策本身进行推理,而不会陷入细节。

抽象是编写优秀软件的一个非常著名的工具,但要想出正确的抽象几乎从来都不容易。我们在软件系统抽象方面有很多经验,但在网络安全方面没有太多经验(我的重点)。

为什么特别是“数学”抽象?Edsger Dijkstra引用的话说明了一切:“抽象的目的不是为了模糊,而是为了创建一个新的语义层,在这个语义层中,人们可以绝对精确。”当安全策略存在时,它们通常是用语言表达的。我不能用文字工作。它们可能是模糊的或不一致的。我需要更精确的语言,没有任何语言比数学更精确了。

更重要的是,如果我们使用数学定义,我们将继承数百年来美丽的理论来帮助我们推理结果。如果可能的话,你为什么不想要数学抽象呢?

在最近的论文中互联网的“强大但脆弱”特性,你和你的合著者探讨了在复杂网络中寻找统一属性的想法。随着物联网(IoT)似乎增加了计算机网络的复杂性,识别统一属性将如何提高我们有效管理这些网络的能力?

我认为物联网不会增加互联网的基本的复杂性,或者至少它不会像改变规模那样增加复杂性,以及为什么会在这篇文章中解释。

该论文的核心观点之一是,当时的互联网结构模型完全错误。学术界注意到幂律学位分布在许多网络(包括互联网,但也包括社会和生物网络)中很常见。幂律是一个简单的模型,用于描述具有高变化的分布(其中可能发生比典型事件大得多的事件),它们在自然界中具有显著的规律性。因此,在像互联网这样复杂的事物中看到它们也就不足为奇了。

然而,在互联网的背景下,幂律网络所使用的模型是“颠倒的”,即它们将极端高度数的节点放置在核心或主干网的网络中心。实际上,这是不可能的。路由器和交换机的技术限制意味着核心是由低级别但高容量的设备构建的,而高级别的节点出现在引入大量用户的网络边缘。非正式地说,我们可以认为网络是通过在边缘扩展成许多细分支来增长的,核心或树干越来越厚,就像你想象的植物生长一样。

物联网只是延续了这一趋势。它在边缘创造了巨大的增长,核心需要增长容量来支持增长,但核心实际上不需要改变太多。边缘向外扩展。

因此,关于大型运输供应商的网络管理,本文的信息是期待更多相同的东西。

对于处于网络边缘的互联网服务提供商(ISP)来说,这是不同的。他们可以期望更多的设备连接到他们的网络中,这将产生新的压力。首先,它应该推动互联网协议(IP)版本6的采用。它还将在一个全新的层面上造成网络安全问题,这是每个人的问题。

简而言之,这就是“强健但脆弱”的故事。网络对某些类型的增长和变化(尽管面临许多挑战,但互联网还是取得了成功)非常强大,但对其他类型的干扰却很脆弱,安全就是最明显的例子。

你已经表示,你对网络的兴趣延伸到了生物和社交网络。关于计算机网络,你学到了什么,并且能够应用到这些不同类型的网络中?

在过去20年左右的时间里,互联网的发展过程比我们以前建立的任何工程系统都更类似于生态系统的演变。它的成功在于它促进了协议、硬件和应用程序的创新。但同样的快速创新环境允许一切发生。净效应是一个看起来(在我看来)更像珊瑚礁的系统,而不是飞机、摩天大楼或其他复杂的工程系统。

因此,我认为社交网络和生物网络与互联网之间有很多相似之处。也许你已经从我之前的回答中看到了这一点,但我认为还有一个更好的例子:网络安全。网络安全是一个很好的例子,因为这个类比给了我们有用的教训。我们已经在这个领域使用了生物类比:我们谈论“病毒”和“蠕虫”,有很好的理由——这些类型的攻击可以用与其生物类比完全相同的方式建模。但生物学还有更多的东西要教给我们:简单的例子包括:

  • 单一文化对寄生虫和其他形式劫持的脆弱性,以及对单一架构和垄断提供商助长攻击的理解的延伸;如果每个人都使用不同的操作系统,那么黑客的规模及其经济性都会发生巨大变化·
  • 越来越多的中间盒用于修复或改进网络的某些方面(例如,网络地址转换),这代表了一种动脉硬化,造成僵化并导致新的漏洞;
  • 寄生虫及其同类的进化速度比它们捕食的系统更快;
  • 如果不小心使用,治疗和预防药物会很快失效,例如,我们目前的抗生素耐药性问题;
  • 复杂(例如,多细胞)系统/实体有许多漏洞,因此如果我们需要对系统(例如,发电站)进行严格的安全保护,那么应该很简单。

当我们建造更先进、更自动化的网络防御系统时,我们也应该着眼于自然。想想我们的免疫系统,它会出什么问题。当病毒破坏免疫系统本身时会发生什么?或者当免疫系统出现其他故障时?有时这些失败比疾病更糟糕。因此,我们的教训是,我们必须注意,我们的防御不仅会增加脆弱的攻击面,而且会给黑客带来可能造成更大伤害的攻击点。

对我来说,密码管理系统就是一个简单的例子。这真是个好主意。如果你没有,现在就买一个,但不要加入最受欢迎的。我们最不需要的就是将我们安全的关键组成部分打造成一个单一的、单片的系统。这将是一个太诱人的目标,这将导致巨大的努力,以破解它,并发生大规模的破坏。我们拥有一个多样化、充满活力的生态系统,拥有许多这样的工具,我们的生活会更好。

当然,类比是一种高级工具,而且很容易理解。关键在于细节,类比太过可能是危险的。因此,我们回到了对精确抽象和工具的需求上来。

马修·罗汉是阿德莱德大学数学科学学院教授,澳大利亚数学与统计前沿卓越研究委员会中心首席研究员。他的研究兴趣包括互联网测量,以及网络的性能、效率、优化和测量。他还从事过网络安全和网络提供方面的工作。

Roughan被任命为ACM Fellow(2018年),因其在互联网测量和分析方面的贡献,以及在网络工程方面的应用。