皇帝的新耳机:
VR有什么问题

你首先需要知道的是,我不是一个虚拟现实(VR)爱好者。“虚拟现实”是在(通常是头戴式)显示器上观看三维图像的一大亮点。图像在空间上看起来是固定的,占据了整个视野。我不喜欢VR本身,而是因为大公司、技术专家、未来主义者、企业家、广告商、风险投资家、学者、新闻记者——总统——几乎所有人都在宣扬它的最新化身——救世主般的热情。尽管自60年代以来,VR在寻找主流观众方面一再失败。

我想通过对该技术潜力的理性评估来缓和VR外来主义的复兴。因为我想让它对VR爱好者有用,下面的大部分内容都致力于提出实用的策略,这些策略是我在开发前两个版本的谷歌Cardboard时开发的,用于利用我们所知道的与技术交互的知识来识别和实现VR更温和但实际的承诺。我的希望是,演示一条通往海滩的渐进路径,至少可以防止一些旅鼠从悬崖上冲下来。

SIM:情境沉浸式媒体

虽然我为VR支持者的乐观主义喝彩,他们戴着汗流浃背、笨重的耳机看到了《星际迷航》全息甲板的起源,但目前不可能将VR体验误认为是真实体验,所以让我们用诡辩的说法来说明,耳机中的“虚拟”体验与“真实”体验有任何有意义的联系体验。我不想成为这次讨论的主题事实上的什么都可以,更不用说了现实我将养成一个陈旧而烦人的习惯,即精确定义我的术语,以便我们都知道正在讨论什么。

我们的主题是一种新的体验媒体模式——主要是视听,但可能包括触觉——它具有两个主要的交互特征:

  1. 它是沉浸式的也就是说,它填充了用户的整个视野,从而吞噬了他/她。
  2. 它是位于,即,它与用户相对于真实空间的位置、方向和移动相关联。

我更喜欢这个词情境沉浸式媒体(SIM)描述一下立体耳机显示器对术语“虚拟现实”产生的“哇,这真是太棒了!”的效果,这既是因为它的规范性较低,也是因为它携带的行李较少(割草机工人,有人吗?)。为了取得成功,SIM必须明确浸入和情境(或更常见但有问题的术语“在场”)的用途和可取性。假设它们的效用是自证的——比任何技术障碍都要强大——这是过去技术的绊脚石。

沉浸并不是SIM独有的。沉浸就是被淹没,失去对沉浸媒介之外的一切的意识。媒体本身很少像其内容那样重要;书籍、电影、对话、白日梦、音乐和木工都能让人身临其境。SIM卡的沉浸感与内容完全无关,因为从物理上看它是不可能被忽视的。不可回避性带来了新的互动可能性,但暴力沉浸与活动中的完全吸收不同,它本身也不好或不可取。我从未听过任何人抱怨媒体中“缺乏沉浸感”,或谈论体验不够“沉浸感”。正如我所听到的SIM支持者所说,人们在尝试SIM之前不会意识到他们错过了沉浸感,但好的内容无论在何种媒体中都是沉浸式的,当然,与SIM相比,它可以轻松实现。

与沉浸不同,空间精确的三维SIM支持者术语“存在”实际上是SIM独有的,它确实恰当地描述了处于模拟空间中的感觉——这是不可否认的那里那里。我更喜欢“情境”而不是“在场”,因为它的内涵是空间的,而不是经验的。瑜伽教练不会告诉你“处于”当下。不管怎么说,SIM卡中包含的感觉是如此令人惊讶,以至于第一次SIM卡体验经常被宗教术语描述为“转换”或“顿悟”,并被描述为“超然”或“超凡脱俗”。正如一位科技高管最近告诉我的,“我知道我们还没有找到VR的杀手级应用程序,但它如此引人注目,我简直不敢相信竟然没有。”

这几乎是肯定的,但不是他想象中的结构性PC/Internet/Social Media/iPhone规模。这是因为沉浸感和情境必然会限制SIM比其他媒体更好地传达的信息类型。接下来的是一系列包含这些限制的指导方针,以帮助消除炒作,并专注于推动SIM采用的用途。他们根据互动情境和独特的沉浸感来构建SIM卡,而不是将其作为咒语,将耳机强加给对其用途感到困惑的公众。他们强调了假设,并提出了可能不正确或不实用的替代方案,但旨在激发不同的想法。

1.瞄准边缘系统

因为它如此令人信服地愚弄了我们的视觉系统,SIM感觉就像是直接进入了预知大脑,完全避开了符号处理。情境和沉浸感主要在潜意识层面发挥作用,产生一种感觉上的即时性,相当于锤击膝盖的反射。例如,SIM从本质上传达了物体相对于你的大小,以及它们之间的空间。与在屏幕上相比,SIM卡中的比例感觉不协调。想象一下,在大教堂或飞机库内观看一段视频。在电视上,你知道它们在概念上是巨大的,但在SIM卡中,你会感觉到它们的巨大,就像你站在里面一样。SIM动画人物的肢体语言也是如此,无论是拍摄的还是计算机生成的,你都能立即和下意识地感知到最细微的线索。这就好像SIM代表了一个新的、独立的通道,直接将信息传递给你的蜥蜴大脑。关键问题是如何最好地利用这样一个渠道。

一部恐怖电影可能会吓到你,一个悲伤的故事可能会让你哭泣,但这些都是代表主人公感受到的代理情绪。SIM卡会让你直接陷入激怒他们的境地,从而引发不同类型的恐高、被追逐、尴尬恐惧。SIM可以处理的情感调色板要广泛得多,也要微妙得多,因为它们直接属于你。这样,SIM更像是一个梦想,而不是一部电影。当你摘下SIM耳机时,你会敏锐地注意到这一点,你的大脑会像你醒来时一样,在将感官环境重置为现实世界的过程中轻轻地移动一下。

2.不要这么直言不讳

沉浸和情境是SIM的显著特征,但要想发挥作用,它们必须为意义服务。仅仅把一个用户放在一个巨大的空间里,告诉她环顾四周,而不把感到渺小的体验附加到一个目的上是不够的。SIM卡中的空间提示可以让用户感觉自己被跟踪了,感觉自己无处藏身,感觉自己被温柔地监视着,感觉自己完全孤独,感觉每个人的眼睛都盯着他。这些是复杂的、非理性的情绪,SIM卡创建者可以利用这些情绪来增强故事,为会议定下基调,或者做一些全新的事情。把用户放在圣礼拜堂的中心,只是因为这是一个很好的技术演示,但这相当于一次游乐园之旅,你试了一次,然后就继续。说“它更具沉浸感”或“你感觉自己就在那里”并不能解释为什么SIM值得这么麻烦,就像说“它是红色的,圆的”解释了为什么西红柿很好吃一样。

“啊哈,”你说,“但感觉你在那里有用!”空间理解与实际经验的融合正是我为什么更喜欢“情境”而不是“存在”的原因。这种说法通常是这样的:如果你负担不起/病得太重/去某处旅行太危险,那么SIM是次佳选择。但次佳到什么为什么叙利亚难民营的SIM卡捕捉到的视听环境的保真度高于视频,但目的何在?用户体验了难民营的规模和空间背景,但与在探索频道观看纪录片后相比,他再也没有“去过那里”,也没有感受到难民的感受。最近在中写入大西洋,耶鲁大学心理学家保罗·布鲁姆解释道:

问题是,这些体验从根本上讲与眼前的物理环境无关。难民经历的可怕之处不在于难民营的景色和声音;这更多地与不得不逃离自己的国家,重新安置在陌生的土地上的恐惧和焦虑有关。

他认为,要想感受难民的感受,要想真正成为难民营中的难民,第二件最好的事就是咨询第一人称的书面或口头描述。我想说的是,SIM的隐喻性、非文字性的使用可能会让人产生类似的恐惧和焦虑。这种体验更像一首诗或一首音乐,而不是一部纪录片。

3.编辑所有内容

不直译的很大一部分是明智的编辑。模拟和现实一样,既复杂又费力,这使得它对飞行员和外科医生的培训非常有用(顺便提一下,SIM已经被使用了几十年),但在其他情况下,它很快会导致感官过载。没有人会争辩说,谷歌搜索应该模拟在无限大的壁橱里翻阅数百万盒文件。您输入一个查询,无需进一步查找,就会弹出答案。它利用了计算机的独特功能,为您节省了现实世界搜索的繁琐。

类似地,没有人真的想在虚拟抽屉里翻找一支虚拟铅笔,用它用虚拟的手在虚拟笔记上乱涂乱画。我们的想象力比最完美的全息甲板更强大、更逼真;假设目标是一个完美的模拟是误解SIM的潜力。

大多数人也不想通过360度浏览流媒体信息来寻找故事。环顾四周寻找有趣的片段并将其拼凑在一起是一件很累的事情,也需要做很多工作,只需问问作家或记者即可。交互式小说的问题一直是很难从较小的、可重组的单元中动态构建引人注目的故事。迄今为止,我体验过的最成功的沉浸式互动叙事形式是不要再睡了但这不仅仅是一个故事,而是一种经历。当我复述它时,我谈论的更多的是我的感受和我做了什么,而不是我所看到的各种角色碰巧在做什么。这个故事最终是关于我的,它不像看传统戏剧、看电影或看书那样令人抓狂。这就是SIM卡竞争—不是其他SIM卡体验,而是所有其他媒体。

4.结合其他媒体和设备进行设计

微软犯了一个严重的错误,它将Kinect的骨架追踪定位为游戏控制器的替代品——“你就是控制器”——而不是控制器的附加输入(想象一下,玩一个赛车游戏,除了用控制器控制汽车外,你还可以利用头部和肩部的角度来帮助汽车转弯,或者用沙发上的你撞到其他玩家,将他们撞到屏幕上)。

他们用一种慢得多、笨重得多的身体信号灯取代了手的高外观操纵能力。这是用你的手解魔方和用你的双手指挥别人从房间的另一边解魔方的区别。

沉浸式媒体也面临着类似的挑战。如果任何SIM设备要成功,它必须在所有其他现有媒体的环境中进行。阻碍SIM取得主流成功的主要原因是缺乏一个关于SIM如何与其他平台和设备交互或增强其功能的故事——电视、手机、笔记本电脑、印刷品、架构、性能、网络、游戏机——以及它为用户与它们的交互增加了什么独特价值。

想象一下,在屏幕上用一张本来是空的SIM卡看电影。一个角色从宾夕法尼亚车站出现,第一次瞥见了纽约。当她看到时,屏幕消失了,纽约到处都是观众。突然的规模和形势的影响将是惊人的,就像那个角色第一次看到市中心一样。或者,如果老鼠突然从舞台上辩论的两位政客脚下向观众涌来。或者如果一部普通电影有一个SIM部分,其中主角经历了隧道视觉。这些表达的可能性令人难以置信,而且基本上没有被开发。

5.针对您拥有的技术进行设计

自成立之初,SIM就一直在等待技术赶上它的雄心壮志。也许正是因为这种潜在的叙述,有一种感觉,所有当前的SIM技术都只是未来神奇、无形耳机的草图。考虑到这项技术的工作原理,这根本不可能。根据定义,SIM卡需要遮住用户的眼睛来遮住外部世界。无论是昨天吊着起重机的两吨重头盔还是明天精致的小眼罩,这都是真的。

例如,Telepresence是SIM卡最常被引用的用例之一。尽管通信一直在逐渐远离沉浸式,但现在大多数人际通信都是以图像、短视频和文本的异步方式进行的,这是对SIM社交可能性的热烈讨论。这有点痴心妄想的味道——过去二十年来塑造我们沟通方式的数字工具无疑将即时性置于逼真性之上,并将更深层次的自我封闭性置于首位。蒙住眼睛“看”某人实际上有一种明显的“为了拯救村庄,我们不得不摧毁村庄”的意味。

在一个空间化的3D视频会议中,远程参与者与实际参与者无法区分,这将是一件很棒的事情,但当所有人的眼睛都被遮住时,这绝对是不可能的!但是如果那些眼睛没有一直被遮住怎么办?

6.不认为互动是理所当然的

不同的SIM卡体验需要不同类型的输入。通过为每种类型构建适当的输入,SIM创建者最终可以得出最适合整个系统的抽象的用途和类型。没有必要一开始就泛化,重新创建现有的界面元素(列表、按钮、滑块、键盘),或者在现有界面上对SIM交互进行建模,尤其是在任何人对SIM的用途有了明确的概念之前。虚拟对象的头部旋转、手部运动和操作不需要像在SIM外那样进行,只要交互一致且直观,可以快速理解。

这对SIM卡硬件来说更是如此。在公共场合遮住眼睛是一种非常反社会的行为(而且可能是危险的),即使是在半私下里,也需要对同伴有很大的信任。这限制了人们愿意长时间佩戴SIM耳机的情况。但谁说这些经验必须扩展?硬件真的需要头罩吗?如果它的使用更像显微镜或双筒望远镜呢?例如,想象一下SIM耳机的行为更像电子烟。如果你发现自己在会议上很生气,为什么不偷偷溜到你快乐的地方呆一会儿呢?

7.最后,小心游戏

由于模拟、虚拟旅行和远程临场感等传统的替代产品无法销售耳机,因此,人们的注意力肯定会集中在游戏上。玩家们愿意接受障碍,忍受各种各样的侮辱,这是他们在非游戏环境中不会遇到的。他们会戴上头盔,挥舞像杠铃一样的控制器,投资于特殊的跑步机,并从事在更广泛的社会背景下可能是愚蠢的行为。

把数十亿美元的技术的未来仅仅局限于游戏是危险的。玩家是一个反复无常的群体,游戏技术不能很好地应用于其他用途,因为游戏的交互设计往往是玩家必须克服的障碍之一,玩家必须执行不可能的按钮组合,反应速度比有意识可能快,记住敌人的动作和位置,解读神秘的线索和要求。简单的游戏是无聊的游戏。对于人们经常使用的大多数其他系统来说,情况并非如此。

旧问题需要新的解决方案

尽管有一种主流的说法是相反的,但SIM在过去五十年里未能找到大量受众与技术几乎没有什么关系。与其说是成本、延迟或跟踪自由度,还不如说是将沉浸和情境简单地应用到他们不适合的任务中。这就像是注意到手术视频会让人们失去食欲,并得出结论,看阑尾切除术将是下一个减肥热潮。

最后,重要的是要指出,并非每种媒介都是大众媒介。我相信只有在SIM中才能充分表达创意吗?SIM是最适合表达创意的方式吗?当然,为什么不呢?我认为这一定意味着SIM卡是一种未来的大众媒体,值得投入大量的资金和人才吗?当然不是。SIM是2D媒体散文中的诗歌:它有一小群热情的追随者,但它的制作和消费需要比大多数人更多的耐心、技术能力和持续参与。而且它极不可能使任何人致富。

现实世界是乏味的;否则,人们不会如此兴奋地逃离它。复制这种现实实际上浪费了SIM的潜力。错误引用麦克卢汉的话:给定SIM卡作为媒介,什么是合适的信息?我不清楚,但我有预感SIM卡可能代表一种新娱乐方式的开始;在这种娱乐中,用户既不是主角(如游戏或第一人称叙事),也不是冷漠的观察者(如电影或全知叙事),而是一种自愿的艺术主体,其行为和情感被作者间接操纵。第二人称媒介。或者完全是其他东西,一种充分利用SIM边缘和空间表现力的形式。然而,找出答案的唯一方法是放弃长期以来对SIM是什么以及如何使用SIM的先入为主的观念,而将重点放在它独特的交互作用上。