焦点评论 > 正文
从可用走向可信共建人脸识别良性生态环境
2022/6/6 09:03   人民邮电报      关键字:可用 可信 人脸识别 生态      浏览量:
从疫情防控健康码查验、交通安检等公共应用到金融支付、出入门禁等,人脸识别应用已经深入到人们生活的方方面面。从技术角度来看,当前人脸识别发展状况如何?不同应用场景下对人脸识别技术要求有何不同?如何解决日益凸显的个人信息保护问题?
  近日,北京健康宝更新,“他人健康码代查询”可通过人脸识别、姓名和身份证信息进行认证授权,家庭成员、安保人员等可通过此功能为老人、儿童提供帮助。从疫情防控健康码查验、交通安检等公共应用到金融支付、出入门禁等,人脸识别应用已经深入到人们生活的方方面面。从技术角度来看,当前人脸识别发展状况如何?不同应用场景下对人脸识别技术要求有何不同?如何解决日益凸显的个人信息保护问题?针对业界关注的这些问题,《人民邮电》报记者分别采访了中国信通院云计算与大数据研究所人工智能部副主任石霖和北京邮电大学“鸿雁人才”特聘教授邓伟洪。
  多元应用场景多维度评判人脸识别效果
  记者:20世纪60年代有研究人员开始研究人脸识别,进入初级应用阶段是在90年代后期,从发展历程来看,人脸识别重点的研究领域、研究方法是什么?
  邓伟洪:人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。它涵盖采集包含人脸的图像或视频流,检测和跟踪人脸,精确定位到面部特征点,并进行特征提取和比对识别的一系列相关技术。
  近年来,除了身份识别,性别、年龄、种族、情绪等人脸属性,甚至某些遗传病、抑郁症、性格倾向等隐含特征,也可以被识别。20世纪70年代以来,该研究经历了五官几何特征、像素变换特征、局部滤波特征和深度卷积神经网络四类主流技术路线。目前,主流的深度卷积神经网络推动了人脸识别的广泛应用,在很多场景的识别准确率已经超过了人眼。
  石霖:人脸识别技术经历了传统机器学习和深度学习的技术发展阶段。传统方法依赖于人工设计的特征与机器学习技术的组合。自2014年引入深度学习方法后,人脸识别技术发展迅猛,识别效果开始超过传统机器学习,并呈现出训练数据规模越来越大、识别精度越来越高的趋势,目前在人脸识别领域,深度学习已经取代了传统机器学习。当前,基于深度神经网络的人脸识别在权威数据集LFW(LabeledFacesintheWild)上的识别准确率达到了99.5%以上,远超出了人眼的97.52%,也随之带来了人脸识别商业应用的爆发式增长。
  记者:评判人脸识别效果的主要标准是什么?
  石霖:描述人脸识别性能的指标主要包括准确率、错误接受率、错误拒绝率。尽管近年来人脸识别技术的准确性已大大提高,但随着人脸识别应用的逐渐深入,仅从性能维度进行评价并不能满足特定场景下的实际需求。
  我们认为,要全面客观的评价人脸识别的应用效果,需要看人脸识别系统本身是否具备能够被用户信任的技术能力。随着人脸识别的大规模应用,频繁出现系统被黑灰产攻破、用户个人信息被泄露、人脸技术滥用、对部分人群的识别结果存在偏见等负面新闻,这些问题也逐渐成为用户对人脸识别系统是否信任的关键。因此,为有效回应用户关切,我们认为需要围绕安全可靠、透明性、数据保护、明确责任、公平性五个可信特征,结合其使用场景来评价人脸识别系统是否具备相应的可信能力。
  邓伟洪:传统的标准主要是准确率。对于1∶N的识别应用,准确率就是从数据库中精确搜索出目标人物的正确概率。针对高铁、机场等1∶1的验证应用,准确率是指在很低的错误接受率下的本人验证通过率。在准确率已经满足使用需求的今天,人们开始追求更加全面的识别效果,包括在口罩遮挡、侧脸、年龄变化等极端条件下的稳定性、对抗样本攻击和活体攻击的安全性,以及在多人种人脸识别下的公平性等。
  记者:对相似性比较高的情况(比如跨年龄、跨姿态)怎样保证识别的准确性?应用的主要算法、研究方法是什么?
  邓伟洪:目前主流的方法是深度卷积神经网络,该网络结构能够提取像素、边缘、五官、属性等多层次的人脸特征,对年龄、姿态甚至整容等外观变化有很强的适应性。模型参数的学习主要依靠海量的人脸数据驱动完成,通过学习训练数据中同一人的多张年龄、姿态等变化的图片,并增强同一人的这些图片特征的一致性。经过数百万甚至数亿图像的训练后,网络可以获得对年龄、姿态等稳定的识别准确率。
  石霖:使用更大、更具有代表性的数据集,更好地遵守图像质量标准以及其他措施。
  记者:日常考勤、银行办理业务、健康宝等都需要“刷脸”,在不同应用场景下,对人脸识别的技术要求有何不同?
  石霖:不同业务场景下对于人脸识别的技术要求存在很大的差异,主要体现在易用性和安全性两个方面。在楼宇门禁、考勤打卡等通常有人值守的低风险场景下,需要在提升通行效率的同时,实现人员身份的核验,一般不会受到黑灰产的恶意攻击,因此易用性相对来说是更为重要的考量因素。
  而在线上业务办理、刷脸支付、大额转账等涉及用户人身财产安全且通常为无人值守的高风险场景下,需要确保人脸识别不因受到黑灰产攻击而失效,因此需要最大限度地提升人脸识别本身的安全性。除此之外,在金融、政务等行业的部分场景中,人脸识别只是用户身份认证的一个因子,通常还包括姓名、身份证号、卡号以及手机验证码等其他因子,以确保人脸识别被攻破的情况下,身份认证业务不被绕过。
  邓伟洪:除了所有应用都有的准确率要求,特定应用场景下还需要考虑两个方面:易用性和安全性。例如,门禁考勤等应用为了保证大人流下的通过效率,会适当调低人脸验证的阈值,保证绝大多数人可以快速通过,避免反复拍照验证。金融业务需要特别高的安全性,产品中就会加入多类型的传感器来进行额外的安全验证。例如,支付宝和苹果手机的刷脸支付都引入了三维传感器来防御伪造人脸的攻击。易用性和安全性在应用中是矛盾的,需要根据场景来进行调节。
  从可用走向可信多元共治形成合力
  记者:在安全性方面,人脸识别准确性面临哪些威胁?目前比较有效的解决思路是什么?
  邓伟洪:随着人脸识别的广泛应用,各类安全性威胁是伴生出现的。打印人脸照片、显示屏播放人脸、三维打印面具甚至硅胶面具等越来越逼真的活体攻击手段,对人脸识别的安全性带来极大挑战。同时,常用的深度卷积神经网络本身还存在内在的漏洞,攻击者可以通过优化方法生成对抗噪声来控制人脸的识别结果,由于叠加在图像上的对抗噪声幅度很小,从外观上人们还难以发现异常。
  正如俗话说的“未知攻,焉知防”,目前的防御方法都是针对不断演进的攻击手段设计的。例如,采集各类活体攻击视频,生成对抗攻击的样本作为训练样本,专门学习区分正常和异常样本的分类器来进行防御。但这些方法都不能从根本上解决问题,攻击和防御方法呈现迭代优化的态势。
  石霖:从技术上看,在一些特定的实验条件下人脸识别确实已经达到了99%以上的准确率,但在实际应用场景中,表情、年龄变化、遮挡、光照强度等因素,都会影响人脸识别的准确率。对于人脸识别准确率,可以考虑从三个方面进行提升:一是在确保训练数据的可靠、可追溯的前提下,拓展训练数据集,做到全面、准确;二是优化人脸识别技术流程,确保前端采集到的人脸图像满足后续识别的质量要求;三是结合实际应用中的反馈,做好算法模型的升级迭代。
  从应用上看,人脸识别作为一种身份认证技术,同密码、指纹等传统身份认证技术一样,都存在一定被攻破的概率,现阶段尚不存在百分之百安全的技术,黑灰产常用的呈现攻击、注入攻击,以及更为前沿的对抗样本攻击,均有可能造成人脸识别失效。
  中国信通院云大所依托“可信人脸应用守护计划”已开展了两轮针对人脸识别系统安全性的评测,着重检验了人脸识别系统抵御电子图像攻击、合成视频攻击等主流黑灰产攻击手段的能力。在评测中我们发现,当前移动端人脸识别系统普遍采用了移动端和服务端联动的方式进行活体检测,具体呈现形式包括“动作”“动作﹢唇语”等,能够有效区分真人与各种呈现类攻击。另外,部分人脸识别系统能够通过设备安全检验、链路安全校验、动态调整相机参数等方式有效识别非摄像头实时录制的注入视频,从而进行拦截。
  记者:人脸识别技术发展成熟的标准是什么?未来的发展趋势是什么?
  石霖:人脸识别作为一项近年来快速发展的生物识别技术,尽管在金融、政务、安防、交通、教育、医疗等行业得到了广泛应用,但也暴露出在实际场景下的准确性降低以及安全和合规等一些需要解决的问题。长远来看,人脸识别技术和应用发展的不断成熟,需要政府主管部门、科研机构、法律机构、技术提供方、技术使用方以及用户方共建一个良性的生态环境,中国信通院云大所发起的“护脸计划”,就是联合社会各界组建的一个开放平台,也欢迎各方积极参与,共同提升全行业的安全合规能力,促进产业的健康发展。
  目前,在开展护脸工作的过程中,我们也看到人脸识别技术产业的发展呈现出了以下几个趋势。一是多种认证技术融合。人脸识别虽然能带来良好的用户体验,但并不是百分百安全的技术,以金融行业为例,越来越多的机构开始采用“动作活体﹢炫彩活体”“人脸识别﹢声纹识别”等身份认证方式,提升系统整体的安全性。二是从业厂商主动“合规”。随着《数据安全法》《个人信息保护法》等相关法律法规的出台,越来越多的人脸识别从业者加入“护脸计划”,寻求合规的产品设计、研发方案,这些从业人员多数来自新零售、金融行业,在实际从业过程中直接接触大量的人脸信息,主动“合规”的意愿也越来越强。三是探索人脸识别替代性技术。我们也发现,一些人脸识别的从业者迫于合规的压力,在部分场景放弃了使用人脸识别,转向了研发和使用人体识别、掌纹识别等新的识别技术,这些技术在一定程度上规避了法律上的合规风险,但其实际的应用效果和安全性都有待考验,也都是“护脸计划”需要跟踪和探索的新方向。
  邓伟洪:人脸识别技术发展成熟的标准应该是“可信”,“可信”的内涵十分丰富,至少包括高于人眼的识别准确率和稳定性、对各类群体具有公平一致的识别效果、应对各类恶意攻击的防御能力,以及对识别结果的可解释性等。未来的技术发展趋势是从目前的“可用”走向“可信”,从唯“准确率”的跑分走向多元发展的识别技术。

微信扫描二维码,关注公众号。