当Siri遇到我的儿子时:
我孩子的用户体验课程

在休产假期间,我原本想从UX设计师的工作中休息一下,但发现自己无法摆脱。看着我年幼的儿子学习基本的人类技能成为了一项关于人类互动的研究,这让我对为成年人设计数字体验有了新的见解。因为婴儿都是关于界面的。

关于新生儿的一件有趣的事:他们已经在一个为他们提供一切的环境中怀孕了九个月——营养充足,温度稳定,排泄物被清除。然而,从他们出生的那一刻起,他们就被转变成了可以称之为学习机器的东西。婴儿只具备完成任务所需的基本本能,他们花费了大量时间和精力来学习如何驾驭对他们来说是一个全新的平台——母亲的身体。他们很快发现它是一个很好的舒适和温暖的平台,也是治愈饥饿的源泉。他们立即学会抓住母亲的乳房,学会如何吸奶几天之内,他们就能识别出人脸的图案。从那时起,婴儿每天都会面对新的界面。他们必须在不阅读手册的情况下发现一切。

起初,当我看着我的婴儿时,它引发了我的初步思考和认识——“嗯,我想所有的婴儿都会这样做,”或者(有点恐慌),“哇,他完全脆弱,完全依赖我生存。”只是过了一段时间,我才更加适应了我面前展开的学习过程。我的想法变成了“哇,人类学习速度太快了”,“他懂重力?没人教过他!”我对他的里程碑的记录成为了设计研究的一种形式。尽管我只是以我自己的儿子为中心,但我慢慢意识到,我所看到的对更好地理解人类学习行为的本能具有指导意义。

当然,用户学习和适应新界面的能力在交互设计中起着巨大的作用。设计师预测用户对新系统的反应的能力也是如此。因此,从界面设计的角度来看,让婴儿如此有趣的不仅仅是他们作为“全面学习者”的状态。最近与独立康奈尔大学领先的婴儿研究中心Babylabs的研究员卡斯帕·阿迪曼博士说:“如果你想了解人类的心理,从婴儿开始是有意义的。成年人太复杂了。他们要么告诉你你想听到的,要么试着猜测你。”但如果婴儿做了什么,他总结道:“这肯定是一个真正的回应。”

我们对良好界面设计的欣赏很大程度上与学习的自然程度有关。门把手和灯开关是直观设计的好例子,触摸屏也是如此。触摸屏的界面非常直观,甚至六个月大的婴儿都能学会导航,并成功地将其保存在肌肉记忆中。

经过深思熟虑的直观界面设计方法对于成功开发任何需要更复杂学习和适应的创新至关重要。60-80年代早期计算机接口的发展就是一个很好的例子。起初,只有熟练的程序员才能使用它们。但是GUI(图形用户界面)的发明使各种各样的人都可以使用计算机,从而使计算机成为消费品。施乐PARC的Alan Kay的突破性界面工作在计算机成为表达、学习、生产力和沟通的通用工具的过程中发挥了关键作用,这一作用不亚于硬件和芯片速度等因素。GUI的设计基于建构主义,这是一种强调通过做来学习的学习理论,或通过与环境的迭代交互获得知识来“构建理解”。Alan Kay借鉴了Jean Piaget、Seymour Papert和Jerome Bruner的理论,他们研究了儿童大脑中存在的学习直觉能力,以及图像和符号在构建复杂概念中的作用。正如Kay所说,他开始理解到,“处理图像就是符号”。这是GUI背后的前提,它使计算机用户能够通过操作计算机屏幕上的图标实时形成想法。凯的方法使非专业人士可以使用计算机。更重要的是,它把电脑变成了大众创意表达的工具。

这样一个案例研究例证了一个一般原则,我认为,这对于那些以建构主义方法看待价值的设计师来说是有用的:因为婴儿是从没有知识开始的,通过行动学习,密切关注用户体验设计者发现和适应世界的方式,可以为用户体验设计者提供有价值的信息和对界面设计方法的见解,甚至在为成年人设计时也是如此。

在我们这样的时代进行设计尤其如此,这个时代的特点是用户交互的新的、快速发展的可能性非常广泛。

我将概述两种方式,在这两种方式中,我对这一原则的新认识影响了我对界面设计问题的思考。

VR:创造一个对!

当我问我的儿科医生为什么我一岁的孩子经常旅行时,他的回答是,虽然在我孩子的心目中,他擅长走路,能够走得很快,但他的身体并没有跟上。我的孩子被扔进了一个新的环境,他刚开始掌握工具,但他经常摔跤。虽然孩子们当然不会因为一系列摔倒而放弃学习走路,但成人学习者通常不会这样,因为这种情况可能会带来很大的问题。

虚拟现实就是一个很好的例子,它能够让我们生动地想象现实,而不受日常物理含义的限制。当用户第一次戴上VR耳机时,他们对物理定律的感知往往会被颠覆。媒体的身临其境意味着一个人的方向感和平衡感可能很容易被抛弃。虚拟现实将用户带到一个由不同规则控制的感觉不同的空间的力量也是其主要弱点之一的来源:即这种运输经常会引起恶心。

虽然VR内容创作者可能会觉得他们在策划无边界的体验,但我们必须仔细考虑快速融入这样一个新环境所产生的影响和结果。

众所周知,婴儿和幼儿在熟悉的养育环境中吸收信息的速度更快。当把婴儿换到一个新环境时,重要的是要与他们保持一些熟悉感,以便他们在情绪上感到舒适。研究表明,婴儿重复某些行为,直到他们确信自己已经掌握了这些行为因此,当建立一个遵循不同运动规律的虚拟世界时,明智的做法是以缓慢、可控的方式引入新颖的空间元素,以支持“外部”熟悉的特征的存在这方面的另一个重要点是婴儿积极的学习者他们不会被动地坐着接受信息。他们探索和测试自己的知识之路。虽然他们的成长动机和渴望可能与成年人截然不同,但基本的学习原则认为:为了充分参与新世界的学习,观众必须是主角,而不仅仅是观众。

同样,允许重复的、以用户为中心的行为的设计将加快用户对VR场景的学习曲线。考虑到用户的外部现实和代理感的动态响应交互是帮助用户熟悉新体验的关键。

语音识别人工智能:单一思维与开放、全球思维对话

运动能力的获得是幼儿学习的一个领域,语言是另一个领域。我的丈夫和我来自不同的语言背景,我们深深地投入到了解如何在一个三语家庭中最好地抚养我们的孩子。我们能否促进三种语言(英语、韩语和西班牙语)的习得,同时避免造成混淆和发展延迟?

在深入研究有关这个问题的文献时,我惊讶地发现婴儿能够在理解任何给定的语言之前区分一种语言和另一种语言。除了鼓励我们的多语家长事业外,了解这个超级大国还为我提供了一个未来机器学习策略的新视角。

当我在R/GA的一个团队正在进行一个人工智能项目时,我们发现对于许多用户来说,一个令人沮丧的关键点是,由于口音的原因,语音识别算法无法理解用户的口语。“这对我来说从来都不管用,”一位这样的用户在采访中告诉我们,他英语说得很好,带有一定的日本口音。“我试着训练Siri如何读我的名字,但它没有做到。它只适用于常见的英语名字。”

当然,这一问题的原因是众所周知的,因为大部分消费类电子产品用户都知道,这并不是与计算有关的,而是文化和经济决策的产物,这些决策为编程方法提供了信息。一个中心问题(详见信息性文章)是收集数据的费用,这是导致某些关键人口统计学优先考虑的因素,也是一种没有任何身份或口音的AI声音,超越了“主流”

研究婴儿的语言习得能帮助我们解决这个问题吗?在她的书中早期语言习得Patricia Kuhl描述了幼儿天生的语言灵活性。婴儿几乎能辨别语言中使用的所有语音单位,而成年人则不能。婴儿能辨别出生时细微的声学差异,这种能力对语言的习得至关重要。婴儿准备辨别任何自然语言中语音对比的差异这种早期的神经可塑性对婴儿未来的学习至关重要,它规定了语言掌握的基本要素。

语音感知和语音产生发展的通用语言时间线。该图显示了正常发育的人类婴儿在出生后第一年的言语感知和产生的变化。(库尔,早期语言习得第832页)

当人们与婴儿交谈时,他们经常采用某种“婴儿说话”的语调。这种语气在全世界都非常相似。证据表明,这种说话方式有助于婴儿学习基本的言语代码。我们知道如何帮助婴儿学习。考虑到这种“深度教学”,我想知道,如果我们以更接近于我们如何帮助婴儿学习的方式来编程,我们的机器学习程序会是什么样子?如果我们从教计算机最基本的交流技能,即非人类哺乳动物使用的技能开始,然后继续教他们人类特有的技能,例如统计学习,那会怎么样?人工智能可能具有非常不同的能力和增长潜力。

在基于语音识别的产品开发过程中,设计师很少能够影响正在生成的语音的编程,但往往会影响与对话相关的用户体验。设计口音灵活的人工智能算法可以从建模开始,以更类似于人类儿童的方式进行学习。类似Siri的设备发出第一个问候语后的沉默应该能够接受不同人使用的不同风格的语音。设计语音灵活性,而不是预定的“通用”语音模式,将使用户和机器之间的关系有机地紧密。

设计师明智的做法是从婴儿身上的灵活性中学习,并在机器的学习程序中植入一些启示,以便采用不同的口音和语调。我们首先需要让计算机具备婴儿的能力,而不是老学者和工程师的能力。

心理理论考虑到,当与另一个人交谈时,一个人天生希望自己的伴侣注意到你的背景,并考虑到这一点。大多数人会在某种程度上允许他们在话语中使用的词语和节奏随着伴侣的变化而变化。机器还没有出现,但这是我们必须瞄准的地方,以便创造与机器对话更自然的环境。

当然,良好对话所需的灵活性不仅与语音有关。

大多数人都不会容忍一个经常以“我不知道”结束谈话然后立即走开的谈话伙伴。然而,我们的“智能”机器总是切断对话。同样,任何与人工智能对话的人都会很快意识到设计一个吸引人的对话循环的重要性,而不是简单地对机器编程说“对不起”人工智能中的情商(EQ)是我们“智能时代”的下一个挑战

我儿子十一个月大的时候,我们带了一辆亚马逊回声(AKA Alexa)回家。我担心,由于它没有实体的声音,机器可能会把我的孩子弄糊涂。事实并非如此,我松了一口气。我相信Alexa温柔的灯光和声音帮助我儿子微笑并接受了他们的回应。这样的提示可以帮助产生有益的人机交互时刻。但即使考虑到这一点,在人工智能领域还需要做更多的工作,尤其是在人类线索和自然语言领域。

从学习中学习

最近,我在日记中写道,我儿子给了“mong mong”一个大大的吻。mong mong是一种韩语发音的狗吠声。在这个地球上生活了十五个月,他具备了人类模式检测和计算能力,识别出了一只狗,能够将韩语发音与它联系起来,并与一个物体建立了关系——一个象征狗的玩偶。我建议用户体验开发人员从数字时代中抽出时间,利用我们观察周围人以及他们如何学习和构建世界的固有能力,将从中受益匪浅。

我从儿子的学习中学习。随着儿子的成长,我对用户体验设计了解了多少,这让我一直感到惊讶。同时,当我意识到我作为界面设计师的训练是如何帮助我仔细检查和理解我儿子学习导航和理解周围世界的方式时,我对设计师独特力量的信念得到了加强。