3D手势识别背后的技术
汽车(安全)
近期,汽车应用在交通信号、车道以及障碍检测方面使用 2D 传感器技术取得了长足发展。随着 3D 传感技术的到来,3D 传感器的“z”数据将大幅提升场景分析的可靠性。汽车通过使用 3D 视觉系统,现已有了预防事故的新途径,无论白天还是夜间都非常适用。采用 3D 传感器,车辆能可靠检测并解读周边环境,确定对象是否对车辆及车内乘客构成安全威胁。这些系统要求软硬件支持 3D 视觉系统,并需要密集型 DSP 及 GPP 处理性能在极短时间内解读 3D 图形,避免事故。
视频会议
视觉会议技术经过多年发展,已经从间断脱节传输影像发展成当前的高清系统。未来增强型视频会议将充分发挥 3D 传感器的优势,提供更真实、更具互动性的视频会议体验。该增强型视频会议系统具有集成型 2D 传感器以及 3D 传感器及麦克风组合,将能够与其它增强型系统连接,实现高质量的视频处理、面部识别、3D 影像、噪声消除以及内容播放器(Flash 等)等应用。随着这种密集型音视频处理需求的出现,需要具备最佳性能及外设组合的 DSP。

技术处理步骤
对许多应用而言,需要同时具备 2D 和 3D 摄像机系统才能充分实现应用技术。图 3 显示了这些系统的基本数据路径。从传感器获取数据,然后进行视觉分析,这并不像数据路径示意图看上去那么简单。具体而言,TOF 传感器需要的带宽相当于 2D 传感器的 16 倍之多,这可导致高输入/输出 (I/O) 问题。另一个瓶颈则存在于原始 3D 数据向 3D 点云转换的处理过程中。通过正确的软硬件组合解决这些问题,对于手势识别及 3D 的成功应用至关重要。当前数据路径可通过 DSP/GPP 处理器组合加上分立式模拟组件及软件库实现。
3D 视觉嵌入式系统的挑战
输入挑战
如前所述,输入带宽限制对 3D 视觉嵌入式系统提出了极大的挑战。此外,输入接口也没有标准化。设计人员可为 2D 传感器与通用外部存储器接口选择采用不同的输入选项,其中包括串行与并行接口。在支持最佳带宽的标准输入接口出现之前,设计人员只能使用现有的接口。
两种不同的处理器架构
图 3 所示的 3D 深度映射处理可分为两类:一是以数据为中心的视觉专用处理,二是应用上层处理。以数据为中心的视觉专用处理需要处理器架构能够执行单指令多数据 (SIMD) 快速浮点乘法及加法运算,以及快速搜索算法。DSP 是快速可靠执行这种处理功能的完美选择。对于应用上层处理而言,高级操作系统 (OS) 及协议栈则可提供任何应用上层所需的必要特性集。
根据两种处理器架构要求,提供高数据速率 I/O GPP+DSP+SIMD 处理器的片上系统 (SoC) 非常适合 3D 视觉处理,其可支持必要的数据及应用上层处理。
缺乏标准中间件
3D 视觉处理领域的中间件是多种来源的众多不同组件的整合,包括开源(如 OpenCV)与专有商业源等。商业库主要针对身体跟踪应用,这是一种特定的 3D 视觉应用。目前尚未开发出针对所有不同 3D 视觉应用标准化的中间件接口。
“z”(深度)之后会有什么精彩?
没有人质疑 3D 视觉的诱人因素。工程师早已在期待未来的应用发展。那么不久的将来会出现哪些最新技术?研究人员已经在开发针对人和对象的各种视觉技术了。全球研究人员正在使用多路径光分析技术,探索实现转角视觉或绕开对象的视觉途径。透明研究将带来可透视对象和材料的系统,而运动检测系统则将带来查看人类大脑内部的应用,从而可检验一个人是否在撒谎。
3D 视觉与手势识别技术的发展会带来无尽的可能性。不过,如果没有支持这些振奋人心的新技术所必须的硬件及中间件,该研究将没有任务意义。提供 GPP+DSP+SIMD(通用处理器+数字信号处理器+单指令多数据流)架构的 SoC(系统芯片)不断发展,将提供处理性能、外设支持以及必要带宽的完美组合,从而可实现这种振奋人心的技术与应用。
三维扫描仪相关文章:三维扫描仪原理 全息投影相关文章:全息投影原理
评论