人工智能研究人员可以从外星人猎人那里学到什么?

SETI研究所的方法为人工智能研究提供了经验教训

6分钟读取

Edmon Begoli是橡树岭国家实验室人工智能安全研究中心的创始主任。

Amir Sadovnik是橡树岭国家实验室人工智能安全研究中心的研究负责人。

照片拼贴了一个人用双筒望远镜向上看,和一只机器人手用一个尖尖的手指从中露出彩色的线。
图片:盖蒂图片

人工通用智能(AGI)的出现——能够执行人类任何任务的系统——可能是人类历史上最重要的事件,它从根本上影响了我们集体生活的各个方面。然而AGI,它可以很快就会出现,仍然是一个难以捉摸且有争议的概念。我们对它缺乏明确的定义,我们不知道我们将如何检测它,也不知道如果它最终出现,我们将如何应对。

然而,我们所知道的是,目前研究AGI的方法还不够严格。在当今许多人工智能突破正在发生的行业内,公司开放人工智能积极努力创建AGI,但仅将AGI的社会层面和安全问题研究作为企业领导者认为合适虽然学术界更广泛地看待AGI,寻求一种新的智能生命形式的特征,但学术机构没有足够的资源进行重大努力。

思考AGI,我们会想到另一个理解不足的推测现象,它可能对人类产生变革性影响。我们相信研究所他探测先进外星智能的努力展示了几个可用于AGI研究的有价值的概念。SETI项目没有采取教条主义或耸人听闻的立场,而是采取了科学严谨和务实的方法,为定义、检测和解释可能存在的外星智能迹象提供了最佳的可能机制。

SETI背后的理念可以追溯到60年前,也就是太空时代的开始。在他们的1959自然纸张,物理学家朱塞佩·科克尼菲利普·莫里森描述了搜索星际通信的必要性。假设外星文明存在的不确定性和技术的复杂性,他们就外星社会将如何尝试沟通进行了理论推导,并讨论了我们应该如何最好地“倾听”信息。受这一立场的启发,我们主张采用类似的方法来研究AGI,尽管它存在各种不确定性。

人工智能研究人员仍在争论AGI出现的可能性以及如何检测AGI。然而,定义AGI的挑战和测量AGI的困难并不是忽视AGI或采取“我们看到它就会知道”方法的理由。相反,这些问题加强了对AGI检测、评估和公共教育采取跨学科方法的必要性,包括对AGI相关风险.

我们现在需要一种类似SETI的AGI方法

过去几年显示了人工智能能力的巨大飞跃。支持聊天机器人的大型语言模型(LLM)聊天GPT它能与人类进行令人信服的对话,重新引发了关于AGI的讨论。例如,最近的文章指出ChatGPT显示AGI的“火花”,是有推理能力、和超越人类在许多评估中。

虽然这些说法很有趣也很令人兴奋,但有理由对此表示怀疑。事实上,一大群科学家认为,当前的一套工具不会让我们更接近真正的AGI但是,考虑到与AGI相关的风险,如果发生AGI的可能性很小,我们必须认真努力制定AGI的标准定义,建立一种类似SETI的方法来检测AGI,并设计出在AGI出现时与之安全互动的方法。

挑战1:如何定义AGI

关键的第一步是明确要寻找什么。在SETI的案例中,研究人员决定寻找所谓的窄带信号有别于宇宙背景中的其他无线电信号。这些信号被认为是有意的,只由智能生命产生。

就AGI而言,情况要复杂得多。如今,“人工通用智能”(其他术语,如强人工智能、人类智能和超智能也广泛用于描述类似的概念)。这个术语很难定义,因为它包含其他不精确且有争议的术语。虽然“智能”在牛津字典作为“获取和应用知识和技能的能力”,对于涉及哪些技能以及如何衡量这些技能,仍有很多争论。“一般”一词也是模棱两可的。AGI需要做人类能做的一切吗?一般性是作为二进制变量还是连续变量来衡量的?

“用于AGI的SETI”构建的首要任务之一必须是明确定义“通用”和“智能”两个术语,以便研究界能够具体一致地谈论它们。这些定义需要以支持AGI概念的学科为基础,如计算机科学、测量科学、神经科学、心理学、数学、工程和哲学。一旦我们对这些术语有了明确的定义,我们就需要找到衡量它们的方法。

还有一个关键问题是,一个真正的AGI是否必须包括意识、人格和自我意识。这些术语也有多种定义,必须澄清它们与智力之间的关系。尽管人们普遍认为意识对智力来说不是必要的,但它经常与AGI的讨论交织在一起,因为创造一个有自我意识的机器会产生许多哲学、社会和法律影响。一个新的大型语言模型能够比人类更好地回答智商测试,它是否与真正有意识的机器一样重要?

一个机器人仰卧着,仰望星空。华盖创意

挑战2:如何衡量AGI

在SETI的情况下,如果候选窄带信号检测到一个专家组将核实它确实是外星来源。他们将使用既定标准作为示例,查看信号类型和来源,检查重复性,并在多个设施进行所有评估,以进行额外验证。

如何最好地衡量计算机智能一直是该领域的一个长期问题。在一个著名的1950年论文,阿兰·图灵提出了“模仿游戏”,现在更广为人知的是图灵测试(Turing Test),它评估人类对话者是否能够区分他们是在与人聊天还是与机器聊天。尽管图灵测试在过去对评估很有用,但LLM的兴起清楚地表明,它是测试不够完整测量智力。正如图灵在他的论文中指出的那样,模仿游戏在测试计算机是否能够模仿语言生成过程方面做得很好,但模仿语言和思维之间的关系仍然是一个悬而未决的问题。当然还需要其他技术。

这些评估必须针对不同的智力维度。虽然对人类智力的测量存在争议,但智商测试可以为评估一个维度提供初始基线。此外,需要对创造性问题解决、快速学习和适应、推理、目标导向行为和自我意识等主题进行认知测试,以评估系统的一般智能。

这些认知测试将很有用,但重要的是要记住,它们是为人类设计的,可能包含一些关于人类基本能力的假设,这些假设可能不适用于计算机,甚至那些具有AGI能力的计算机。例如,根据机器的训练方式,机器在智商测试中可能得分很高,但仍然无法解决更简单的任务。此外,人工智能可能还有其他通信方式和能力,而这些是我们传统测试无法测量的。

显然需要设计新的评估来准确测量AGI或其子维度。这一过程还需要来自不同领域的不同研究人员,他们深入了解人工智能,熟悉当前可用的测试,并具有设计新颖测试的能力、创造力和远见。当AGI取得有意义的进展时,这些测量结果有望提醒我们。

一旦我们制定了AGI的标准定义,并开发了检测AGI的方法,我们就必须设计出解决AGI出现的方法。

挑战3:如何应对AGI

一旦我们发现了这种新的智能形式,我们就必须准备回答这样的问题:新发现的智能是一种新的生命形式吗?它有什么样的权利?我们对这一情报有什么样的权利?潜在的安全问题是什么?我们处理、控制AGI实体并保护自己免受其影响的方法是什么?

在这里,SETI也提供了灵感。SETI已经协议处理外星智慧迹象的证据。SETI的探测后协议强调验证、透明度以及与联合国的合作,目的是最大限度地提高过程的可信度,最大限度地减少耸人听闻,并为如此深刻的事件带来结构。

与外星智能一样,我们需要与AGI进行安全交互的协议。这些AGI协议将成为国际公认的框架,用于验证突发AGI属性,为整个过程带来透明度,确保国际合作,应用与安全相关的最佳实践,并处理任何道德、社会和哲学问题。

我们欣然承认,SETI的类比只能走到这一步。如果AGI出现,这将是一种人为现象。我们可能会逐渐设计AGI,并看到它慢慢出现,因此检测可能需要几年甚至几十年的时间。相比之下,外星生命的存在是我们无法控制的,接触可能会突然发生。

真正AGI的发现将是科学史上最深刻的发展,其后果也将完全不可预测。为了做好最好的准备,我们需要一种系统、全面、原则性和跨学科的方法来定义、检测和处理AGI。以SETI为灵感,我们建议AGI研究界建立一个类似的框架,以确保以公正、科学、透明和协作的方式处理人类历史上可能最重要的发展。

对话(0)