潮科技 | Oculus 揭秘 Touch 控制器追踪技术“LED 匹配”
头图来源 | Oculus官网
编者按:本文来自微信公众号“映维网ARVR”(ID:YivianXR),作者映维网,原文题目《Oculus揭秘 Touch 控制器追踪技术:LED 匹配》,36氪经授权发布,略有删减。
(映维网 2019年11月05日讯)映维网曾在九月分享了一篇关于 Oculus Constellation 追踪系统,其中负责 AR/VR 设备输入追踪的 Facebook 工程经理安德鲁·梅利姆(Andrew Melim)撰文介绍了他们是如何用基于 Constellation 追踪的控制器来提高交互保真度。日前,梅利姆再次撰文,并讲解了他们在最近版本更新中所采用的最新 LED 匹配方案。下面是映维网的具体整理:
从二维 blob 到三维姿态
摄影测量中存在一个经典问题:Perspective-n-Point(PnP),亦即在给定图像及其里面的已知 3D 点的情况下识别 camera 姿态。我们要解决的问题是确保控制器追踪工作正常进行,而与 PnP 问题相反的是,我们已经能够很好地估算出头显 camera 姿态,但我们希望找到具有已知 3D 点(LED)的控制器姿态。
一旦检测到摄像头成像中的每个红外 LED,我们需要解决的困难是确定从每个 blob 到控制器特定 LED 的映射。我们利用 LED 位置及其到 blob 的映射来确定控制器的位置和方向。由于我们仅使用头显数据来执行跟踪,所以我们必须高效地执行这一过程的每个部分。
计算机视觉中的 Blob 是指图像中的一块连通区域,Blob 分析就是对前景/背景分离后的二值图像,进行连通域提取和标记。标记完成的每一个 Blob 都代表一个前景目标,然后就可以计算 Blob 的一些相关特征,如:面积、质心、外接矩形等几何特征。同时可以计算 Blob 的颜色、纹理特征,而它们都可以作为追踪的依据。基于 Blob 的追踪属于基于区域的追踪。
在将 blob 与 LED 匹配的过程中,我们围绕可能正确的潜在匹配生成一组假设。为了计算出准确的姿态,我们需要最少的匹配项。我们的算法能够根据我们处理的各种变量来从概率方面确定最可能的正确匹配。不正确的映射会纳入直接导致姿态估计不准确的错误,所以我们需要在每帧中获得足够的准确匹配。
用多视图来优化匹配
为了解决 LED 匹配问题,我们实现了在每帧上运行的多种方法。但广义上讲,它们分为两个主要类别。第一是穷举方法,亦即强制应用解决方案,而我们通俗地将其称为“暴力匹配”。当没有关于控制器位置和方向的先验信息时,我们就会使用这些方法。当从前一个摄像头图像中获得控制器的姿态时,我们就可以在更小的窗口内进行搜索,而我们将其称为“接近匹配”。
在一开始,管道一次搜索一个 camera 中的 blob。这要求假设生成 blob 和验证 blob 都在同一个camera 中,亦即意味着一个 camera 中至少要检测到4个 blob 才能成功匹配。另外,它非常有可能导致多个 camera 之间产生矛盾匹配结果。为了解决这个问题,我们开发了全新的匹配管道:在评估不同 camera 中的 LED-blob 对应关系时,它将利用立体摄像头校准数据。这使我们能够依靠每个摄像头之间的关系来帮助解决不确定性。
这个方法改善了单个 camera 缺乏足够匹配,但当所有 camera 图像组合在一起时就具有足够匹配的场景。最严重的情况是控制器靠近视场边缘,太远、太近或存在遮挡。
由于匹配结果是整体评估,而非根据单个 camera 评估,所以这同时排除了匹配结果不一致的可能性。这有助于扩大控制器的追踪量,并减少因为过于靠近头显或视场边缘而造成的追踪损耗,从而实现了更为流畅的追踪体验。
用更少的数据进行计算
从理论上讲,仅给定一个 camera 图像,你至少需要看到三个 LED 才能解析控制器的姿态。但是,仅利用三个点会产生多种可能的解决方案,所以我们需要至少四个正确的匹配才能稳健地解析姿态。
摄像头一次只能看到3个,2个,或者甚至1个 LED 是相当普遍的情况,所以我们设计了一个可以使用其他信息并支持较少 LED 的求解器。反过来,它包括以下的全新求解器,并使得我们能够追踪那些特别具有挑战性的方向:
P2P pose solver
使用2个匹配项和先前的姿态方向信息来解析姿态的位置 component。
将最小匹配要求减少到3个(2个假设生成匹配和1个验证匹配)。
P1P pose solver
使用预测姿态直接验证匹配,而非通过统计或最接近预测进行验证。
将最小匹配要求减少到2个(为了立体姿态优化,确保适当地限制平移和缩放)
在少于4个 LED 的情况下,使用仅位置的立体姿态优化。
经过大量的实验,我们发现 P2P 求解器和 P1P 求解器都需要非常准确的先验信息(良好的追踪状态和准确的预测),因为它们依赖于预测姿态来作为解决问题的严格约束。
但在“粗暴匹配”中,先验信息不太可靠,所以我们注意到诸如错配控制器或错配光管之类的问题。这促使我们开发了稳健的状态机,它允许我们能够在各种求解器之间进行转换,从而确保我们使用正确的方法来处理 Quest 和 Rift S 每天遇到的各种困难动作。
尽管这些改进极大地帮助了我们,但我们在改善整体体验方面还有更多的提升空间。
相关推荐
潮科技 | Oculus 揭秘 Touch 控制器追踪技术“LED 匹配”
潮科技 | Oculus官网披露全新移动VR头显,代号“Del Mar”
潮科技2020 | 「年度科技产品」top100榜单正式公布
潮科技 | 英国 XR 医学培训初创公司「Touch Surgery」完成 5400 万英镑债务融资,领投方为硅谷银行
潮科技 | Oculus 宣布未来 SDK 不再支持 Gear VR
潮科技 | Facebook将Oculus Go移出企业服务平台,Oculus Quest成为其开发重点
潮科技 | 英国初创公司「Litho 」夹指AR控制器公开发售,售价200美元
在扎克伯格眼中,AR的未来是这样的
潮科技2020 | 「36氪读者最喜爱的年度科技产品」评委团揭秘
焦点分析 | 这次的Facebook Connect,藏不住扎克伯格的野心了
网址: 潮科技 | Oculus 揭秘 Touch 控制器追踪技术“LED 匹配” http://www.xishuta.com/newsview12500.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94953
- 2人类唯一的出路:变成人工智能 19253
- 3报告:抖音海外版下载量突破1 18966
- 4移动办公如何高效?谷歌研究了 18490
- 5人类唯一的出路: 变成人工智 18351
- 62023年起,银行存取款迎来 10127
- 7网传比亚迪一员工泄露华为机密 8182
- 8顶风作案?金山WPS被指套娃 7096
- 9大数据杀熟往返套票比单程购买 7045
- 10五一来了,大数据杀熟又想来, 6865