科技前沿-人眼对增强现实空间的理解

发布于 2021-04-05  115 次阅读


本文翻译记录相关知识以供笔者学习,更多内容请移步原文

从工程的角度来看,我们的眼睛是精密的光学传感器,它的结构长期以来一直被用作设计相机的蓝图。光通过一系列光学元件进入。折射和聚焦发生在这里。光圈控制通过光圈的光量。随后的光图案落在一个图像平面上,电信号从该图像平面发送到大脑。然后将这些信号解码为图像。虽然眼睛的功能本身是一个有趣的话题,但为了简单起见,我冒昧地省略了眼睛的大部分工作原理。但我相信你明白了一般的想法。更有趣和相关的是这种惊人的有机光学传感器能够为人类带来什么。

可见光谱

人类的视觉因光而存在。光是电磁辐射的一种形式,是人类视觉的关键刺激。这种辐射以波的形式穿过空间,能够刺激视网膜产生视觉感。电磁辐射是根据它的波长分类的,波长是两个波峰之间的距离。虽然整个电磁波谱包括无线电波、红外线、X 射线和其他波类型,但人眼仅对 380-740 纳米之间的窄带敏感*。这被称为可见光谱。
*1 纳米 = 1 米的十亿分之一


超人的 X 射线视觉
超人的想法是增强人类的想法。X 射线视觉是他的能力之一。这只不过是一种简单的说法,他的视网膜对更广泛的电磁波敏感(抱歉破坏了这个想法的浪漫)。如果增强现实设备能够让我们看到更广谱的电磁辐射,它将让我们离成为超级人更近一步。

人眼的基本特性

视野 (FOV)

它被定义为双眼可见的图像的总角度大小。平均而言,水平双目 FOV 为 200 度,其中 120 度是双目重叠。双目重叠对于立体视觉和进一步讨论的其他深度线索尤其重要。垂直 FOV 约为 130 度。

瞳距(IPD)

顾名思义,它是眼睛瞳孔之间的距离,是双目观察系统极其重要的考虑因素。这个距离因人而异,因性别和种族而异。不准确的 IPD 考虑可能导致眼睛镜片对准不良、图像失真、眼睛疲劳和头痛。成人的平均 IPD 约为 63 毫米,大多数在 50-75 毫米范围内。儿童的最小 IPD 约为 40 毫米。

眼部缓解

这是从眼睛角膜到第一光学元件表面的距离。它定义了用户可以获得完整视角的距离。这是一个重要的考虑因素,尤其是对于佩戴矫正镜片或眼镜的人。眼镜的眼距约为 12 毫米。使用户能够调整眼距对于头戴式显示器来说极为重要。

出瞳

这是由光学系统传输到眼睛的光的直径。

眼盒

这是用户可以放置他们的学生以完全体验视觉效果的空间。

空间视觉和深度线索

从字面上看,数十亿个信号被发送到大脑皮层进行分析以形成图像。有许多空间和深度线索使人脑能够破译这些光信号以创造我们可见的现实。

视网膜外线索

这些类型的线索是生理过程的结果,而不是来自进入眼睛的光模式的结果。

调节(转移焦点)
调节是一种视网膜外提示,可帮助眼睛在前景和背景中的物体之间转移焦点。睫状肌环绕虹膜以帮助观察者在不同景深之间快速转移焦点。眼睛晶状体的光焦度发生变化。当眼睛在舒适的距离注视物体时,这些肌肉会放松。当眼睛需要关注附近的物体时,睫状肌会收缩或调节。这就是为什么当您需要放松眼睛时,建议您向远处看的原因。

Vergence
这是一个相当简单的想法,当看远处的物体时,两个眼球都向中心旋转,以便对齐图像以供大脑处理。当物体靠近时,眼球会稍微向彼此靠近。这种同步旋转称为辐辏。


为什么适应和收敛是 AR 的重要概念?
许多 AR 眼镜用户经常抱怨头痛和眼睛疲劳。这是由于眼睛聚焦在距离眼睛几英寸以内的平板上。即使 3D 对象看起来很远,深度的错觉也只是模拟的。除此之外,眼睛向大脑提供的感觉线索不匹配。眼睛必须长时间适应和收敛,这是造成这种不适的主要原因。在模拟真实深度的同时减少调节和聚散的影响是一个有待解决的有趣问题。

视网膜或深度线索

这些线索来自进入眼睛的光模式。这些提示要么是双目的(有两个眼球对这些提示有影响),要么是单眼的(即使只有一个正常工作的眼球也可以观察到)。

立体
视觉 我们有两只眼睛,它们的平均距离约为 2.5 英寸。每个眼球捕捉到的图像略有不同。由于大脑正在处理的两个图像中的轻微偏移而观察到的感知深度称为立体视觉。立体视觉对于沉浸式头戴式 VR 显示器尤为重要。向每只眼睛显示的两个单独的图像,甚至图像中的轻微位移都会导致立体视觉的损失,从而使 VR 体验感觉不自然。

将眼睛靠近屏幕,这样一只眼睛只能看到一个立方体。
如果您使用手机,请确保它处于横向模式以获得最佳体验

立体视觉是这里讨论的唯一双目提示。其余的线索都是单眼的。

运动视差
这是一个强大的深度提示,即使两个对象以相同的速度移动,更近的对象看起来比远处的对象移动得更快。这样做的原因是,较近的物体会比远处的物体更快地穿过您的视野。此信息对于模拟 3D 环境中移动对象之间的相对深度非常重要。

遮挡或插入
当一个物体挡住另一个物体的视野时,就会观察到这些提示。大脑将阻挡物体记录为比被阻挡物体更近。对于计算机必须知道视图中近处和远处物体位置的 AR 场景,模拟遮挡效果尤其困难。使用深度感应相机将是解决附近物体这一问题的可行解决方案。

删除和
增加 这个提示是运动视差和深度提示的扩展。当一个对象移动到另一个对象后面时会发生删除,而当对象在观察者的视点中显示自己时会发生吸积。如果删除和吸积发生得很快,则该对象被注册为更接近阻塞对象。如果两个对象距离较远,则删除和吸积会缓慢发生。

线性透视
该深度提示是线向远处的单个点收敛的结果。平行线似乎退到远处。线越多,它们出现的距离就越远。

线性透视
一系列轮廓的动态深度效果

动力学深度效应
这种效应是从物体的运动中感知物体的结构。这种效果在显示对象的复杂结构时特别有用,即使在缺少其他深度线索时也是如此。

熟悉的尺寸
这个深度提示帮助我们估计物体相对于周围元素的尺寸。这在数据可视化中特别有用,其中显示相对大小为用户提供了数据的视角。

绿房子看起来比黄房子小

相对大小
两个大小相似但距离不同的物体,相对于它们与观察者的距离,被认为是不同的大小。两个大小相同但距离不同的房子投射出不同的视网膜图像,这被视为距离提示。

相对大小和相对高度

相对高度
在大多数正常设置中,靠近视野的物体在视网膜区域的下部可见,而较远的物体在较高的部分可见。

大气或空中透视
此深度提示是光被蒸汽和烟雾等粒子散射的结果。随着距离的增加,物体与背景之间的对比度会降低。

大气透视

纹理渐变
这是一个重要提示,物体纹理的逐渐变化(通常从精细到粗糙)会产生深度感知。一个纹理单元的密度或一个单元的高度或纹理之间的距离的减小给出了距离的感觉。

纹理渐变

照明、阴影和阴影
这是艺术家和建筑师最常用和最常用的深度提示之一。阴影的角度和清晰度会影响深度感知。清晰和清晰定义的阴影表示更接近,而模糊的阴影可能表示更深。此外,光与不规则形状物体相互作用的方式可能会揭示有关物体的重要信息。

光学扩展
该提示是相对尺寸提示和遮挡的扩展。随着物体的视网膜图像尺寸增加,它似乎越来越靠近并开始遮挡其路径中的物体。

球似乎越来越近了

了解人眼的工作原理可以帮助我们构建更自然的 AR 体验,并为虚拟环境的未来做出重大贡献。

如堕五里雾中
最后更新于 2022-03-28