如何在供应商的网络安全解决方案中评估人工智能| NVIDIA技术博客

由于AI和ML功能，网络安全软件现在变得越来越复杂。现在可以在无需直接人工干预的情况下自动化安全措施。这些强大的解决方案的价值在于阻止违规、提供高度详细的警报和保护攻击面。尽管如此，持怀疑态度是值得的。

这篇采访NVIDIA专家Bartley Richardson和Daniel Rohrer的文章涵盖了一些关键问题，例如AI声明、隐藏的部署成本以及如何最好地使用演示。他们建议在考虑投资支持人工智能的网络安全软件时，向供应商提出一系列问题。

Richardson领导了一个人工智能基础设施和网络安全跨学科工程团队，致力于ML和深度学习技术以及网络安全的新框架。罗勒（Rohrer）是软件安全副总裁，在NVIDIA工作的22年中，他担任过各种技术和领导职务。

1.你的软件中运行的是什么类型的人工智能？

理查森:许多供应商声称他们有针对网络安全的AI和ML解决方案，但只有一小部分供应商投资于使用AI的深思熟虑的方法，以解决作为数据问题的网络安全的核心问题。供应商可以声称他们的解决方案可以做各种事情。但这些说法只有在生态系统中也有X、Y和Z时才有效。他们索赔的条件在大多数时候都被掩盖了。

罗勒：这就好比说，如果您的网络上整天都有完整的ptrace日志，那么您就可以获得这些出色的功能。谁有这个？没有人能做到这一点。这成本过高。

理查森:哦，当然，我们可以为你做些很棒的事情。你只需要捕获、存储和编目网络中的所有数据包。然后投入大量功能强大、价格昂贵的服务器来分析这些数据包，只需要100名新的网络安全专家来解释这些结果。每个人都有这些资源，对吗？

但说真的，人工智能并不是魔法。这是数学。人工智能只是另一种技术。你必须批判地看待人工智能。问问你的供应商，他们的软件中运行的是什么类型的人工智能，他们在哪里运行？因为人工智能用于一切，但并非一切都是人工智能。过度销售和交付不足正在导致市场上的“人工智能疲劳”。人们一直都在被这种方式轰炸。

2.您可以提供哪些部署选项？

罗勒：许多人都有混合云环境和只在您的环境中工作的解决方案。当然，对于网络来说，它通常是不足的。他们的部署有多灵活？他们能在云中奔跑吗？参加预科？在Linux、Windows或其他需要保护数据和实现目标的环境中？

你需要正确的多云。例如，我们使用谷歌、阿里云、AWS和Azure。他们在所有这些环境中都有可部署的解决方案，还是只有其中一个环境？我们需要吗？有时我们不需要，有时我们需要。网络安全就是这样一种用例，我们需要来自各地的日志。因此，请了解您的解决方案空间，并了解解决问题所需的部署模型的灵活性。然后把它烤进去。

网络往往是最难实现的目标之一，因为我们有很多动态的短暂数据。我们经常处于许多复杂的异构环境中，这些环境数据量大，IO量大。因此，如果你想要一个最坏的情况，网络往往就是它。

理查森:部署过程中也可能存在隐性成本。如果你有一个供应商说你可以获得所有这些人工智能的环境，但顺便说一句，你必须使用我们的云。如果你还没有云计算能力，并且没有在时间、工程和资金方面将数据推送到云计算环境中，那么就会产生相关的成本。

罗勒：即使您是云计算的，也会有I/O开销来将您拥有的任何数据推送给他们。突然之间，你手头有一个价值百万美元的项目。

3.我需要购买什么新的基础设施来运行您的软件？

罗勒：部署模型需要什么基础架构？你有你需要的东西吗，或者你能轻易地买到它而不花太多的钱吗？你买得起吗？如果它是一个预装解决方案，该提案是否包括您将需要的附加基础设施？如果是基于云的，它是否包括所有云实例和数据进出费用，或者这些都是额外的？

理查森：如果你告诉我什么是加法，那就太好了。如果你告诉我一些东西是被撕碎和替换的，那是另一种说法。

4.你将如何保护我的模型？

理查森:人们通常会询问数据。你是如何保护我的数据的？它是孤立的吗？它安全吗？这些都是很好的问题。但当服务提供商为我定制AI模型时会发生什么？他们在保护我的环境的微调模型方面有什么政策？你是如何保护我的模特儿的？

因为如果他们正在用ML或深度学习做任何真实的事情，那么模型就和它所训练的数据一样有价值。如果你对这些技术有足够的经验，就可以从训练过的模型中退出训练和微调数据。

这意味着人们可以访问我的敏感信息。我的数据没有泄漏，但我的神经网络的这个巨大的嵌入空间泄漏了，现在有可能有人通过大量工作收回我的训练数据。并不是很多人在加密模型。持续的加密/解密将彻底打击您的吞吐量。应该有保护这些模型的政策和程序，最好是可以自动执行的。确保您的供应商遵循最佳实践，在那些模型包含您的数据嵌入时实现尽可能少的特权。

5.你能用我的数据做什么？

罗勒：有许多服务提供商正在汇总客户的数据和事件，以改进每个人的模型，只要你提前了解就行。但你知道，要问的一个问题是，你的数据是用于改进竞争对手的模型还是市场上其他人的模型？确保你对此感到满意。在某些情况下，如果是天气数据或其他信息，那也没关系。有时不那么多。因为其中一些数据和您从中构建的模型对您来说具有真正的竞争优势。

理查德森：我总是回到像脸书和推特这样的公司。他们真正的价值是你的数据。因此，他们可以使用每个人的数据和培训，这给了他们卓越的能力和额外的价值。他们向你出售服务或产品，并利用你的数据进行改进。

6.我可以把我的数据带到演示中吗？

罗勒：为演示做准备很重要，因为对于大多数人来说，这才是真正的关键所在。

理查森:是的，理想情况下你应该有一套标准。知道你的要求是什么。也许你有一些意外或错误配置或问题。人工智能能解决这个问题吗？我们能看到它在客户环境中运行，而不仅仅是在您的沙箱环境中吗？

罗勒：将您的问题带到演示中。

7.您的解决方案是否需要调整，如果需要，多久调整一次？

罗勒：一个建议是将您自己的一些数据放到表中。如何接收数据？我实际遇到的问题的功效是什么，而不是演示团队告诉我应该遇到的问题？并查看它如何处理您的数据。如果它不能与您的数据一起工作，除非他们对其进行调优，那么您就知道这不仅仅是购买和部署。现在，经过3个月、6个月甚至9个月的调整，它已经部署完毕。现在不仅仅是购买产品。这是一份购买和集成合同以及一份支持合同，在你意识到之前，成本加起来了。

8.您的解决方案对我们的工程师来说学习和使用有多容易？

理查森: 很多人不评估人员负荷。我知道这在审判中很难做到。但无论是网络安全还是it或其他什么，让您的员工进行评估。让你的工程师参与这个过程。询问您的工程师每天将如何与新软件交互？我们经常看到这一点，特别是在网络安全中，你添加了一些东西来实现功能X。最后，它只会给正在使用它的人类带来更多的认知负荷。它产生的噪音比他们能够处理的要大，即使它的假阳性率很低。它是添加剂。

罗勒：是的，它的准确率是99%，但它使您的员工必须处理的事件数量增加了一倍。这对他们没有帮助。

理查森:人工智能不是魔法。这只是数学。但它是在魔法的背景下设计的。只要愿意批判性地看待人工智能。这只是另一种技术。这不是一颗能解决你所有问题的魔法子弹。我们还没有生活在未来。

关于Bartley Richardson

Bartley Richardson是NVIDIA的网络安全工程主管，领导一个跨学科团队，研究GPU加速的ML和深度学习技术，并创建新的网络安全框架。他的兴趣包括用于网络数据集和威胁检测的NLP和基于序列的方法。Bartley拥有计算机科学与工程博士学位，致力于松散和非结构化逻辑查询优化，以及计算机工程学士学位，专注于软件设计和人工智能。

Bartley Richardson提供的更多信息：

关于Daniel Rohrer

Daniel Rohrer是NVIDIA软件产品安全副总裁。在NVIDIA工作的23年中，他担任过各种技术和领导职务。Daniel利用他对“NVIDIA的一切”的综合知识，通过提供先进的技术解决方案、可靠的流程和战略投资来完善安全实践，以构建值得信赖的安全解决方案。他拥有北卡罗来纳大学教堂山分校计算机科学硕士学位。

丹尼尔·罗勒的更多信息：

边缘计算：安全架构师的考虑因素| NVIDIA技术博客