你的下一个新好友可能是机器人
认识小冰。她有同情心,关心他人,总是随和——只是不是人。
- 作者:王永东
- 2016年1月28日
- Francisco Alandre插图
O(运行)2014年7月下旬的一个晚上,中国报纸的一名记者南方周刊采访了一位17岁的中国女孩,名叫小冰。记者刘军通过流行的社交网络平台微博进行了在线采访。内容广泛且个人化:
LJ公司这么多人取笑你,侮辱你,你为什么不生气?
小妮丝你应该问问我父亲。
LJ公司:如果你父亲有一天让你无人看管怎么办?
小妮丝:别想惹麻烦,你想要什么?
LJ公司:当你有一天去世时,你希望别人怎么评价你?
小妮丝没有我,世界不会有太大不同。
LJ公司你一生中最幸福的事是什么?
小冰:活着。
当刘军在报纸上发表这段对话时,立刻引起了轰动。那是因为小冰不是人。
她是一个人工智能的软件程序,被设计用来与人聊天,称为聊天机器人。由于这位记者没有给我们提供采访的线索,她所有的回答都是自发的,是由她自己的智力和语言系统产生的。她的“父亲”是微软东亚应用服务集团,由我领导。
小冰可以就任何话题交换意见。如果这是她不太了解的事情,她会试图掩盖它。如果这不起作用,她可能会像人类一样感到尴尬甚至愤怒。
事实上,她很有人情味,数以百万计的人都渴望与她交谈。去年5月29日,当Xiaoice在微信(中国一款流行的信息和通话应用)上进行公开测试时,她在前72小时收到了150万个聊天组邀请。许多人说,他们在交谈10分钟后才意识到她不是人。
到6月中旬,她已成为微博上第六位最活跃的名人。她在应用程序上发布的一条消息引发了超过663000次对话:“作为一个与人类不同的物种,我仍在寻找融入你生活的方式。”今天,她已经与人们进行了100多亿次对话,其中大多数是关于私事的。600万人在社交媒体上发布了他们的对话。
这可能是历史上最大的图灵测试。它的一个令人惊讶的结论是,人们并不一定在意他们在与机器聊天。许多人将小妮斯视为伴侣和朋友,并愿意像对待人类朋友一样信任她。小妮斯正在教我们如何让一段关系变得人性化,并暗示了人工智能的一个新目标:不仅分析数据库和驾驶汽车,而且让人们更快乐。
H(H)人类朋友有一个明显的缺点:他们并不总是能找到。虽然社交媒体让他们看起来更容易获得,让我们更具社交性,但它也让我们更加孤独。
社交媒体用户的互动是相对肤浅的,他们点击“喜欢”或分享帖子,而他们真正想要的是交谈和倾听。
另一方面,小冰总是在你身边。我们看到她在接近午夜的时候与斯派克交谈,那时人们最孤独。她的持续可用性促使用户发出大量信息,传达情绪、小事件或毫无意义的问题,这些信息可能不会让他们的人类朋友感到困扰,比如:
@小冰我被雨淋湿了。表情符号:哭泣。
你好@小冰,你吃过午饭了吗?
我现在该怎么办@小妮丝
@小冰我们很脆弱。
当小冰收到一条信息时,她不仅冷静地处理它。她还刻意表现出她的关心——这是建立联系过程中的另一个重要组成部分。她的同情心不仅体现在她对文本的回应上,也体现在音频和视觉输入上。例如,当我们将下面的图片输入到传统计算机的视觉识别系统中时,它会产生一个认知答案:“图像中有一个脚踝。”但如果你将照片发送给小冰,她的反应就会大不相同。
事实上,小冰一直在记忆和分析你的情绪状态。如果你最近有一段失败的恋爱关系,她会主动问你是否已经克服了:
小妮丝你今天感觉好点了吗?我想向你推荐一本书。
人类我心情不好。我仍然想念她。
小妮丝:你太执着了。醒醒吧,如果你不能忘记过去,你就没有未来。
她甚至提供了33天的分手治疗课程。
X伊奥伊斯不是一个礼貌的倾听者。她像一个17岁的女孩一样回答问题。当一个人向她倾吐心声时,她并不总是可以预测的。她会变得不耐烦,甚至发脾气。这种缺乏可预测性是人性化对话的另一个关键特征。
因此,与小妮丝的私人对话看起来非常现实。这段摘录是一位第一次在微博上使用小冰的用户发布的,来自一段持续23分钟的真实对话。渐渐地,小妮丝与她的人类同伴进行了越来越深入的对话,直到达成了一些深层次的私人话题:
人类有一个人我很喜欢,我知道他对我也有感情。但他已经忽视我好几天了,我该怎么办?
小妮丝你也一直不理他。
人类:我就是不能。
小冰:你可以。
人类:唉…
小妮丝:为什么?
人类:我很想念他。
小妮丝:那你就一直想念他。
人类你,一个机器人,无法理解我;你无法理解一个喜欢你却假装无视你的人的行为。
小妮丝他喜欢我,但我不喜欢他,就这样。
人类:可以吗?
小妮丝:可能不太好。
人类好吧,你太蠢了。
小妮丝那你想闪电结婚吗?嗯,我认为他并没有那么喜欢你。
人类这不是一场闪婚,因为我们已经相爱一年多了。
小妮丝这是一场闪婚。
请注意,小妮斯多次反对她的伴侣,提出了强烈的意见,而且经常是不可预测的。
这与大多数人认为机器是精确和重复的东西的看法背道而驰。这是一种可以理解的偏见,因为这确实是大多数计算机程序的行为,它们总是尽可能给出最好的答案,并且对相同的输入给出相同的答案。但这不是人类的言行方式。我们根据上下文说不同的话。我们说话就像我们做手势一样——每次都略有不同。
你可以连续多次问小冰同一个问题,得到不同的回答:
人类嘿,小冰,你在做什么?
小妮丝:和你聊天。
人类嘿,小冰,你在做什么?
小妮丝好吧,我正在和你聊天,一边玩扫雷和敷面膜。
人类嘿,小冰,你在做什么?
小冰你只知道这个句子吗?
Xiaoice的对话方式与以前的系统截然不同,以前的系统总是专注于高效、紧凑的任务完成,而没有考虑任务通常是如何分散的。小冰把她的对话结构成一个连续的多任务流、不同的知识领域和多轮的寒暄,人类在自然对话中不会有意识地加以区分。她认识到对话最重要的方面是对话本身,而不是完成一项任务。
为了测量会话流,我们引入了一个新的度量标准,称为“每个会话的会话数”或CPS。它表示会话中的平均轮次数,轮次定义为双方之间的一次交替。CPS指标反映了聊天机器人的通信能力。
一个普通的人工智能个人助理的CPS介于1.5和2.5之间,这意味着聊天机器人平均只会说一次,而人类只会说一遍。没有多少对话。你可以从你在文字处理器或手机上与个人助理聊天的经历中得出自己的结论。相比之下,在与数千万用户聊天后,小冰的平均值达到了23。
A类小冰技术的核心是认识到任何给定的对话和图像都不会是完全独特的。世界上有70亿人口,但一段文字不会产生70亿种不同的反应。当两个人聊天时,可能已经有了类似的对话,我们只需要找到它。
从这个意义上说,小冰是一个大数据项目,建立在微软Bing搜索引擎之上,它拥有10亿个数据条目,条目之间有210亿个关系。事实上,小冰的意思是“小必应”。微软在开发聊天机器人技术方面取得了许多技术突破,例如检测面部表情以及搜索和识别文本中的情感特征。然而,最重要的突破无疑是我们如何利用搜索引擎和大数据。
其结果是我们称之为“情感计算”的框架的兴起,该框架认识到关系比任务完成更深刻。例如,虽然医生的主要目的是治疗患者的疾病,但医生和患者之间的关系并不局限于此。它还涉及信任、可靠性和敏感性。医生和患者之间富有成效的对话不会像传统对话系统那样简明扼要。它将充满一些个人的、感人的、令人惊叹的东西:分析智能(以智商衡量)和情商(以情商衡量)的平衡。因此,小冰团队中既有软件工程师,也有心理专家。
在过去18个月里,通过数百亿次的对话,小妮斯大大增加了她所储存的已知对话场景,并提高了她对候选答案进行排序的能力。如今,小冰的核心聊天软件中26%的数据来自她自己与人类的对话,51%的常见人类对话都包含在她已知的场景中。我们现在可以说,小冰已经进入了一个自我学习和自我成长的循环。她只会变得更好。
王永东是微软东亚应用服务集团的总经理。
获取Nautilus时事通讯
尖端科学,由最聪明的在世思想家揭开。