手势控制 天下三分
所谓的手势控制(Gesturecontrol)指的是可以通过手部在摄像头上方移动,使手机感应到手的运动,这样就能实现闹钟静音和来电铃声静音(不会挂断电话)的效果。同样的功能已经在当年的爱立信R520m上出现过。不过实现“手势控制”并不太容易,换句话说就是W380i的感应器还不是很灵敏,用户需要多多练习才能提高该功能的成功率。如今,随着技术的不断进步,触摸控制方式正在逐渐取代汽车中控屏上的物理按键。但是,我们也都知道,触控并非是唯一被选择的交互方式。语音、手势甚至包括眼球、意念控制都曾出现在各式各样的概念车上。今儿的主角就是手势控制技术。
车企与IT企业都在秀各自的手势控制,这些酷炫的技术背后,离不开的是测距设备、芯片和算法。
比如说今年召开的CESAsia电子展上,大众就展出了一辆带有手势控制功能的GolfRTouch。当然,大众并不是唯一的参与者。同样是在这届CES上,英特尔展出了3D实感技术,不仅可以捕捉手部动作,还能够实现面部识别、3D扫描建模等。而在随后的谷歌2015年I/O开发者大会上,一款名为ProjectSoli的可穿戴智能设备芯片也能够实时检测双手和手指上的微小活动,并根据设定执行相应动作。这些看上去就酷炫无比让人手痒痒的技术,是怎么做到的呐?
虽然三家公司都是手势识别技术,但是他们三个所采用的具体技术却不尽相同。据透露,大众的GolfRTouch上采用的是ToF技术,英特尔的是结构光技术,而谷歌则使用了毫米波雷达的技术。下面就分别来说道说道。
ToF的全称为飞行时间(TimeofFlight),是一种通过计算光线的传播时间来测量距离的技术。根据距离的不同来判断出不同手指的具体位置,从而判断出具体的手势,再对应到相应的控制命令之上。
要通过光线传播来测算距离,那么就需要一个能够发射光线的装置和接收光线的感应装置。大众使用了一个3D相机模块来发射脉冲光,再利用内置的感应器接收用户手部反射回的光线。然后,根据二者的时间差,处理芯片就可以构建出手部目前的位置和姿势。
通过实时采集这些信息,中控系统就可以调用相应的数据库获得用户正在进行的动作。再根据预先定义的功能,就可以实现不同的操作。由于光的传播速度非常快,基于ToF技术的感光芯片需要飞秒级的快门来测量光飞行时间。这也是ToF技术难以普及的原因之一,这样的感光芯片成本过高。
结构光技术基本原理与ToF技术类似,所不同之处在于其采用的是具有点、线或者面等模式图案的光。以英特尔公司的集成式前置实感摄像头为例,其包括了红外激光发射器、红外传感器、色彩传感器以及实感图像处理芯片。
其基本原理为:首先激光发射器将结构光投射至前方的人体表面,再使用红外传感器接收人体反射的结构光图案。然后,处理芯片根据接收图案在摄像机上的位置和形变程度来计算物体人体的空间信息。结合三角测距原理,再进行深度计算,即可进行三维物体的识别。摄像头把采集到的信息发送到负责实感计算的软件开发包(SoftwareDevelopmentKit,SDK)后,该SDK结合加速度计算器,就可以提供手势识别等功能。
作为一种快速、便携、高精度的三维测量技术,结构光测量技术在航空、模具、医疗等领域均得到了广泛的应用。手势识别只是其中的一个应用案例。
毫米波雷达的原理同样与ToF技术基本相同,只不过用于测量的介质从光线变成了无线电波。ProjectSoli利用内置的毫米波发生器把无线电波(雷达波)发射出去,然后利用接收器接收回波。这时,内置的处理芯片会根据收发之间的时间差实时计算目标的位置数据。
通过比较不同时间段手指位置的不同,ProjectSoli就可以与内置的数据比较,得到手指正在进行的动作。毫米波雷达的缺点在于信号容易被空气阻挡,扫描范围有限,因而对远距离目标探测不清楚,但对近距离目标勘测十分清晰。在主动安全技术中,毫米波雷达的身影已经不可或缺。另外,在近程高分辨力防空系统、导弹制导系统、目标测量系统等均有应用。
大众的手势识别技术在体验过程中虽然反应略慢,但是准确率还不错;英特尔的实感技术据称已经研发了三年之久,在游戏上也已经开始实用;谷歌的ProjectSoli则还只是个展示,尚未正式应用。但是不管是哪一个,车载的路依然很长。大众的工程师表示至少还需要两年的时间才能够把手势识别正式带到量产车型之上,英特尔的实感技术还在与车企接洽,至于谷歌的,就更远了。
ToF技术在应用时具有明显的缺点——“外部叠加误差”。所谓外部叠加误差,是相对于由于光线散射导致的内部叠加误差而言的。误差产生的原因在于相机发射的光线在到达手部时没有直接返回相机的感光原件,而是通过几次不规则漫反射才回到相机模块。这样测量出来的距离就与实际距离不匹配。然而,如果相机中的背景是固定的,感应器就可以忽略外部叠加误差引起的测量错误。大众Golf正是利用车厢这一固定的背景来减少误差带来的影响。
ProjectSoil采用的是60GHz、波长为5毫米的极高频毫米波无线电波来捕捉动作、距离、速度等信息,感应误差精细到毫米。然而,如何把具有如此精度的设备微小化是一件十分苦难的事情,最难的地方在于微小化会影响器件的发射功率和效率、感应灵敏度等。谷歌用了十个月左右才将其从PC主机大小缩小到了硬币大小,且为了提高精度与排除干扰,用到了两个发射器与四个接收器。目前,ProjectSoli还没有正式应用到具体设备中。
至于英特尔的实感技术,从技术本身来说,最需要解决的问题首先是需要验证是否适合用在车内。另外,从现场体验来看,识别的准确度还有待提升。
除了技术研发上的难题之外,用户在使用时的体验也对开发者提出了挑战。
与传统操作方式的不同就要求开发团队设计一套新手教程,以此来让用户逐步体感技术的使用方法;用户在使用过程中可能手的一部分会在探测区域之外;在实际的应用中,系统也会需要根据环境进行摄像头的矫正,存在一个学习的过程。这些都是需要开发团队提前想好应对策略。
微信扫描二维码,关注公众号。