家友评测:使用 Apple Vision Pro 一个月后,“未来”没来,但“现在”更好了
本文共 4000 字,预计阅读时间 15 分钟,底部标注“动图”可点击播放
01 写在前面
笔者在 2 月 3 日自费入手了一台 Apple Vision Pro,此后每天都保持着 6 小时以上的使用时间,算得上深度使用。在数码博主内卷到亲自飞美国抢首发的 2024 年,数码社区的普通用户们“开箱”一个新产品显得微不足道。故在本文中,我想聊聊这一个月来的心路历程,让家友们能从更日常的视角了解 Vision Pro,避免冲动消费。
开门见山的说,Vision Pro 是一个合格的消费级数码产品。尽管它有 600 余克的重量、累赘的外置电池等博主们口中的“硬伤”,我终究是掌握了舒适使用 Vision Pro 的方法与场景,每天促使我摘下头显的原因,通常是晚上太困了。
但是,我不推荐任何人购买本代 Vision Pro。“元宇宙”也好,“空间计算”也好,它们的内核在于“纵深”。遗憾的是,我尚未在 visionOS 中看到任何有价值的“纵深应用”。这代产品更像是个开发平台,它只需要少量用户充当“试吃员”,为软件厂商们提供一个试水新平台的理由,就够了。苹果必然会在不久后发布 Vision Air 等价格低、易佩戴的走量产品。Vision Pro 会和 iPad Pro 一样,永远只是少数用户的选择。
02 初次使用 Vision Pro:没有激动,只有失望官方设计中,Vision Pro 通过头带、缓冲垫、遮光罩这三个部分将机身固定在用户的眼前。换言之,Vision Pro 的本体比广告中的样子要轻便许多,的确可被称为“眼镜”而不是“头盔”。
既然这三件套占用了如此大的空间,想必对产品使用一定很重要吧?可笑的:- “头带”带不住下坠的机身;
- “缓冲垫”缓不了对脸颊的压迫;
- “遮光罩”遮不住环境的强光。
我完全按照官方流程选购、佩戴 Vision Pro,结果,我连坚持到设置完眼动追踪后进入主界面,都非常勉强。仅需 10 分钟,我的脸上就留下了两块无法消去的红印,搞得家人以为我吃年夜饭过敏了。
最终,我以一只手扶着机身的方式,终于开始尝试 Vision Pro。但第二个问题随之而来:我的视野很小,还能感受到左右眼不重合的“黑框”。
为了说清楚 Vision Pro 的毛病,我想简单介绍下 VR 设备的显示原理。尽管 Vision Pro 的两块 MicroOLED 显示器就在我眼前不到 5 cm 的地方,因为 Pancake 透镜的存在,我看到的是一块距离我 1.5 米左右的大屏幕。
在头显领域,视野大小会用 FoV 这个参数衡量。直观地说,那块等效在用户 1.5 m 处的屏幕越大,FoV 就越大,你往眼角看就越不容易看到这块屏幕的边界。请注意,FoV 是客观的、硬件决定的参数,但如果用户未能正确佩戴头显,他就看不到完整的 FoV。而这,才是 Vision Pro “视野小”的本质。
Vision Pro 的遮光罩导致我的眼睛与透镜间有一段无法调节的“镜眼距”。显然,这段距离过长了,因为我看不到 Vision Pro 显示器的边界,反倒是能看到透镜遮住显示器后的边缘阴影。
无论是 Quest 3 还是 Pico 4,因为设备的透镜尺寸足够大,用户很容易就能看到整个屏幕(但透镜大小和 FoV 无关)。Vision Pro 为了压缩设备体积,进而使用了超短焦透镜,透镜尺寸无法做大。这就很容易导致画面被透镜“裁切”。
极厚的遮光罩 + 极小的“眼盒” = 设计缺陷。X 和 Reddit 上早有用户反馈,去掉缓冲垫就能显著改善 Vision Pro 的 FoV,而去掉遮光罩更是让 Vision Pro 仿佛一块“厚玻璃”。扎心的是,“镜眼距”最小的遮光罩型号 21W 在首发时就被抢购一空,就算我身在美国,我也没有去 Apple Store 更换的余地。
03 舒适戴上 Vision Pro 后,“震撼”虽迟但到如果家友们入手了 Vision Pro,我强烈推荐下面这个邪道佩戴方法:
- 将“头带”更换为双环式,并去掉遮光罩;
- 将缓冲垫(薄)从遮光罩上取下,并拿出附赠的缓冲垫(厚);
- 将缓冲垫(薄)卡在透镜周围;
- 将缓冲垫(厚)叠放到第一个垫子上;
- 以头朝下的姿势佩戴 Vision Pro,当缓冲垫与面部充分接触后,抬起头;
- 一只手扶着 Vision Pro,另一只手收紧后脑的绑带,直到缓冲垫受力稳定;
- 进一步收紧头顶的绑带,使眼睛位于 Vision Pro 的正中央;
- 微调两块缓冲垫的相对位置,最终使额头、脸颊均匀受力,且边缘不漏光。
摸索出上面这个方法后,我的 Vision Pro 真有了“眼镜般”的体验:虽然我仍能感受到面部压力,但它成功进入了“触觉适应”的区间;完整的 FoV 相当宽广,正视前方几乎看不到黑边。初步估计,VP 的水平 FoV 有 110 度。
更奇妙的是,眼动追踪、虹膜识别这些听起来很精密的功能,居然完全不受去掉遮光罩的影响。我真心觉得,这才是 Vision Pro 的理想状态。我甚至很难想象别的用户戴着遮光罩怎么能够使用 Vision Pro。
至此,我才有心思欣赏 Vision Pro 的精美画面。单从屏幕参数上看,MicroOLED 的像素密度高达 3386 PPI,全屏亮度可维持 5000 尼特,对比度则趋近无穷。有这样的显示器打底,无论哪个品牌的头显都能有清晰的画面,Vision Pro 反倒没了特色。VP 真正令我“震撼”的地方,是一些与众不同的东西,是只在 visionOS 中才有的东西。
最先抓住我眼球的,是 visionOS 中无处不在的“毛玻璃”。这种视觉效果在 2024 年颇有烂大街的趋势,但我初次在 VP 中看到“毛玻璃”时的震撼,哪怕一个月过去也记忆犹新:- 在平面操作系统中,“毛玻璃”是将后方的内容模糊化后,作为图案填充于背景。而在 visionOS 中,我能透过“毛玻璃”看到其后物体的“虚影”。这个“虚影”是 3D 的,是能用肉眼对焦的。换言之,visionOS 在符合物理规律的基础上,呈现了一种“现实中不可能存在”的材质;
- 这种设计当然有美学考量,但在“混合现实”的应用场景中,“毛玻璃”承担了调节文字对比度的任务。无论是明亮的窗边,还是背阴的角落,“毛玻璃”都能融入环境,并让文字清晰、锐利;
- “毛玻璃”也让平面窗口拥有了“体积”。随着玻璃的位置、倾角的改变,其下方的阴影也会呈现形状与透明度的变化。而阴影在不同平面间的转移也提示着用户,这块玻璃与操作者处在同个时空。
值得一提的是,来自 iPad 和 iPhone 的兼容 App 也会自动获得上述玻璃效果。比如“IT 之家” App,尽管窗口是不透明的,其表面像是覆盖了一层 2.5D 玻璃,在边缘呈现出动态的弧光。
第二个令我难忘的功能,是几乎所有 VR 设备都有的“虚拟环境”。不同于 Quest 等 VR 一体机,Vision Pro 允许用户调节“沉浸度”,这便催生了“一半虚拟、一半现实”的特殊模式。这绝非让两种图像渐变过渡,相反,来自“环境”的光照和空间感都会作用于现实。以“莫哈维沙漠”为例:
- 无论是脚下的砂石,还是远处的约书亚树,模型纹理无限接近实拍,而场景布置却又不失虚拟世界的纯粹。此等写实程度是过往 VR 难以企及的;
- 正因“环境”非常逼真,当它与实际存在的房间拼接时,我不会感到违和。当我从房间走向沙漠时,木质地板与粗糙砂石无缝衔接,这像是梦中才会出现的场景;
- 沙漠上方的高积云在呼啸的西风中缓慢漂移。云影落在沙漠中央,为用户创造了一片光线舒缓的使用空间。而这片带着暖调的荫蔽,也落在了我的房间中;
- 当我在四面封闭的房间中播放视频时,我能隐隐听见沉闷的回声。当我把视频窗口移动到沙漠后,声音瞬间扩散开来。我仿佛从礼堂来到了旷野,这是闭上眼也能感知到的空间的扩大。
受限于篇幅,我无法再说更多 Vision Pro 中令人印象深刻的点。但我还是想快速展示下面几个例子:- 虚拟模型的光效是根据现实空间的光源与景物实时渲染的。最有力的证据就是镜面材质。我能在反射的图像中清楚看到我背后的桌椅与台灯;
- “虚拟环境”不仅影响着 App 的音效,甚至还能对用户的声音做出反馈。比如,在有山的“环境”中,朝着群山呼喊就能听见自己的回音;
- visionOS 不仅能识别用户的双手,还能识别屏幕、键盘等物体。当我在现实中移动这些物体时,与它们相关的 UI,比如 Touch Bar,也会随之移动。
04 妥协的“视频透传”,荒芜的 visionOS
有了 Vision Pro,我可以在月球的环形山旁观看 3D 版《阿凡达:水之道》,也可以面对着哈莱阿卡拉的巨坑游玩 4K 全特效《死亡搁浅》。这些使用场景在我的想象中应当是颠覆性的,但我快活了一周后,一切变得索然无味。
以上案例中,Vision Pro 只是给用户提供了数量不限、大小不限、位置不限的“高清虚拟屏幕”。但屏幕里的内容,并非只有 VP 才能呈现。考虑到通用性和画面质量,VP 也算不上“最好的屏幕”。我于是思考:Vision Pro 到底想解决用户的什么问题?它能创造何种手机、电脑不曾有的使用场景?
Vision Pro 本质上是一台用 VR 技术实现的苹果生态版 Hololens。此类产品在 Hololens 2 与 Magic Leap 相继扑街后,已鲜有在头显市场出现。2024 年的热门头显可分为 3 类:- 以 PSVR 为代表的“VR 显示器”。主要场景是 VR 游戏,需搭配游戏主机使用;
- 以 Xreal 为代表的“AR 显示器”。为用户提供一块附着在镜片上的屏幕,常搭配手机等移动设备使用;
- 以 Quest 为代表的“VR 一体机”。自带手机芯片的 VR 显示器,无需主机就能运行 VR 游戏。其便携性促使一些游戏外的 VR 应用诞生,比如“爱奇艺 VR”。
以上设备和 Vision Pro、Hololens 的核心区别在于:App 是否采用“体积化”的设计。在 macOS 和 Windows 中,一个 App 能在“桌面”上创建多个“窗口”,而“窗口”是 App 呈现内容的唯一方式。
而在 visionOS 和 Windows Holographic 中,一个 App 能在“现实”中创建三种视图:“窗口”、“区域”、“空间”。这是一个 Z 轴不断延伸的过程,而当用户也被包裹在 Z 轴之中,内容铺满了“空间”,visionOS App 与 VR App 就没有差别了。
作为对比,Quest 等 VR 一体机的原生 App 只有“空间”这一种视图。这对 VR 游戏而言是最佳选择,但对日常 App 而言就比较怪异了。比如“爱奇艺 VR”,可交互的 GUI 是“类窗口”的,但为了能在 VR 设备上运行,开发者不得不套一个“虚拟背景”在 App 周围。这个问题在 Quest 3 上依然存在,只不过彩色摄像头的加入允许开发者将“虚拟背景”替换为“实景”。这仍是标准的 VR 开发思路。
话虽如此,价格七倍于 Quest 3 的 Vision Pro 并没有把“体积化” App 设计带到完美境界。首当其冲的,便是“视频透传”。这个方案相比 Hololens 的“透明镜片”有优势,因为虚拟内容和实景总算是来到了一个“图层”。- 很多博主觉得“透传清晰度不如人眼”是该功能的主要缺陷,我不认同。人眼的解析力确实高,但近视的我为了防止视疲劳,矫正视力仅在 0.9。这并不影响我的日常生活。我尝试在开发者模式中获取了一张全分辨率的 VP 透传截图,可以看到,纸张上的文字清晰可辨;
- “视频透传”的最大问题,是宽容度太差。办公桌靠窗摆放是很常见的做法。明明室内采光很好,但 VP 的视野中只要出现“窗户”,室内亮度就会被压低,可以说是毫无 HDR 可言。因此,晚上的房间反而比白天更亮;
- 摄像头的近距离对焦也不太行。哪怕我不戴着 VP 阅读手机上的小字,凑近看清也是常态。“透传”的画质本就不如人眼,我把手机拿近点看还会失焦,这下彻底看不清了。
如果说“视频透传”的局限性只是让 visionOS 的“桌面”难看了点,大量的低质量 App 才更令人担忧。我们不妨来看看苹果为了彰显“开发者的热情”,在 App Store 上架了哪些 🌶️🐔 软件。
但就算是有头有脸的软件,我也没看出 visionOS 特供版与 iOS、macOS 传统版有何区别。以微软 Office 三件套为例,visionOS 版 App 真就是 iPadOS 版 App 换了个毛玻璃皮肤而已。苹果 iWork 三件套里的 Page、Number 甚至连换皮肤的适配都没做。讽刺的是,适配了的 Word,和没适配的 Page,还是 Page 更好用些,因为它在 iPadOS 中并未阉割功能。
到头来,我甚至找不到一款能吹吹 visionOS 的 App。我唯一日常使用的原生 App,是一个名为“Clocks”的虚拟时钟。想理解 visionOS 的“应用困境”,我们首先需要明白头显设备“提供了什么”。答案正如我在开头所说,是“纵深”。
从黑白到彩色,从图像到视频,信息革命通常伴随着内容的“升维”。头显实现的,就是“从平面到立体”的进化。诚然,我们在 2D 显示器上游玩 3A 大作,游戏呈现的内容也是立体的,问题在于:如果游戏视角固定,用户看到的只是一幅画,而不是 3D 模型。
真正的立体,是人类对“纵深”的感知,是基于视觉,但不同于视觉的独立感官。比如,当我们以“斗鸡眼”的方式观看下面这种立体画时,因为其中的图案有远近之分,你就能获得额外的信息。
为什么投射在视网膜上的 2D 影像,经过大脑处理后就变成 3D 了?这是因为用户的左右眼位置不同,因而存在“视差”。比如,如果你将两根手指一前一后摆在眼前,当你盯着前面的手指时,后面的手指就会“分裂”成两根。我们的大脑会根据这些“不重合”的细节,自动解析出距离信息,也就是“纵深感”。
头显设备正是通过向用户的左右眼提供不同的图像,进而传递着“纵深”。不过,仅利用“视差”来模拟“纵深”是不全面的。人眼还能通过调焦等方式测量注视点与本体的距离,而 VR 设备呈现的画面都在一个焦平面上,这有时会导致“焦距”与“视差”获得的“纵深感”存在冲突,进而导致视觉模糊。
介绍完“纵深”的原理,更关键的问题是,“纵深”有价值吗?感性的说,数字内容拥有“纵深”后,感染力更强了。如果一份图像有“平面”和“立体”两种呈现方式,我在 VP 中会毫不犹豫选择立体版本。那种逼真的观感是 2D 屏幕永远无法企及的。
但理性的看,许多 App 在 2D 时就有极高的使用效率,将这些 App “立体化”并非是进步,而是退步。就拿被寄予厚望的建模软件 Spline 为例,它的 visionOS 版本允许用户在现实空间中预览模型效果。这乍一听很合理,但用起来却很不方便。在 2D 屏幕上,我能沿坐标轴精准修改模型的尺寸。而 3D 预览则需要用户移动头部来调整视角,编辑模型全凭感觉。
换言之,“降维”不会丢失信息,反而让信息的传递更加规范、快捷。这好比手写输入和打字输入的关系:手写(二维)确实直观且低门槛,但实际工作中,打字(一维)的速度、可塑性都远高于手写。
05 兼容 App 救了 Vision Pro 一命诚然,App Store 首页挂着的几个原生 App 有些特色,但不多。比如看模型的 JigSpace、玩打碟的 DJay。这些 App 在数码博主的测评中反复出现,我不再赘述。
在 App 中引入 3D 元素乃至 3D 操作界面的想法很酷,但也很枯燥。谁会有事没事带着笨重的眼镜,坐着虚拟的跑车,切着虚拟的水果?与其思考 Vision Pro 的“杀手应用”是什么,我们不妨认真看待一下“买前生产力,买后爱奇艺”这句话。智能手机发展初期,消费者选择购买 iPhone 并不为特定 App,而是看中 iPhone 作为移动互联网终端的便利性。视频通话、博客、论坛、流媒体……这些吸引用户的内容多是“娱乐”属性大于“实用”属性。
现阶段,Vision Pro 至少是一个优秀的“上网终端”。这种说法放 2024 年可能很奇怪:百元机也能刷抖音,买万元 VP 做和手机一样的事,钱太多没地方花?刚上手 Vision Pro 时,我就是这样的想法,因此极力避免安装“兼容 App”。但当我把微信、B 站、IT 之家等手机上每天刷的 App 逐渐装到 VP 上后,我的 iPhone 居然吃灰了。苹果似乎也认识到“兼容 App”的重要性,从 visionOS 1.1 开始,在 App Store 搜索应用会首推 iPhone/iPad 版本。
有了 Vision Pro,我不再需要腾出一只手“握着”App,App 就能自己“漂浮”在眼前。这其实就是让用户的“头”代替了“手”,但不得不说,以面部承受压力为代价,换来双手的自由,这真的会上瘾:- 在枯燥的家务中,我可以把 App 窗口固定在墙壁上,一边拖地、晒衣、浇水,一边追剧、回信、读书;
- 在忙碌的厨房里,我即使满手油污也能毫无顾虑地操作 App,再也不用担心弄脏屏幕的问题;
- 在办公桌前,我的双手无需离开键盘,就能遥控“漂浮”在四周的 App,完成诸如点餐、切歌、排单之类的琐事。
简而言之,Vision Pro 用一套新的交互模式,让“上网娱乐”这件事变得触手可及。某种意义上,这也是对“纵深”的利用,毕竟 App 本身是锚定在三维空间中的。在头显领域,我们一般称这种使用体验为“6DoF”。
支持 6DoF 的头显不少,Quest 就是其中之一。Quest 3 我用了很长一段时间,它的应用场景与 Vision Pro 大概有 20% 的重合度,而哪怕我只聚焦这少数的重合部分,我也从未觉得 Quest 能融入日常生活。这就不得不提 visionOS 中一些关键的“人体工学”设计:- 窗口会测算与用户的距离,自动调节尺寸。比如,你把手边一个 iPhone 大小的 App 移到远处,App 窗口会自动变大,让用户能继续操作;
- 窗口会以用户头部为中心,自动调节倾角。比如,你将正前方的 App 移到右侧,App 窗口会向左旋转,让其中的内容始终正对用户;
- 当窗口被现实中的物体遮挡时,用户若不操作该窗口,它就会把前方的实景显示出来;而当用户激活该窗口后,它又会叠加在实景前,显示完整内容。
06 结语自去年 WWDC2023 的首秀之后,Apple Vision Pro 可以说是拉满了数码爱好者们的期待。“混合现实”的愿景我们早在 Hololens 上就见识过,遗憾的是,它已成为微软的又一个弃子。仔细想来,Hololens 的失败是注定的:没有
高能效芯片、没有软件生态、没有供应链、没有开发者。而 Vision Pro 正是在解决了这些问题的前提下,再次向“MR 一体机”发起冲锋。
某种意义上,Vision Pro 已经成功了,因为它建立在自研芯片、跨平台 SwiftUI、苹果供应链、ARM 操作系统等一系列成功案例之上,是标准的“含着金汤匙出生“。但 Vision Pro 的未来充满挑战。2024 年毫无疑问是 AI 的时代,Vision Pro 无论在硬件层面有多创新,也远不及 AIGC 的人气之高。OpenAI + Nvidia 就像是新时代的 Windows + Intel,苹果至今没能拿出对策。
我期待 WWDC2024 时,苹果能把 AI 技术带入 Vision Pro。当“纵深”这个概念可以被 AI 制造出来的时候,Vision Pro 或许真将掀起下一个移动终端革命。