打开摄像头,轻松扫一扫,即可实现支付;从海量数据库中,公安部门能通过人脸识别系统,找出嫌疑人……像科幻电影一般的人脸识别技术,已逐渐照进现实。
国内人脸识别领域龙头川大智胜正雄心勃勃地布局该领域,然而数据库的采集以及后期市场的应用却是一道绕不开的坎……
传统空管业务的低迷让川大智胜把目光瞄向了三维人脸识别生意。
被誉为国内人脸识别领域龙头股的川大智胜,在9月2日的一则公告中称,公司正在开发的三维人脸识别技术研发迫切需要巨量采集三维人脸并建立三维人脸库。川大智胜使用成都某大学及南方某市社保基金预估采集量的不断攀升,在大范围推广应用期,“需要采集和建库的三维人脸将超过1亿人”。
然而,对于人脸识别技术库数据的来源,在川大智胜此前的公告中,对于如何进行人脸采集的来源均未提及,也没有提示可能涉及的隐私风险。科研建库采集人脸是否基于被采集人的同意?
对此,川大智胜副总经理兼董秘宋万忠对记者表示,“将包括从国内外公开库上下载、付费采集等多种途径,对算法厂商来说,通常这属于商业秘密。”
自建人脸库遇尴尬
2015年初,川大智胜公布定增计划,其中募投1.76亿元的人脸识别项目颇受关注。川大智胜对投资者回复称,计划用三年时间完成高精度三维全脸照相机与三维人脸识别系统产业化,并实现上千万元的利润。
在2日的公告中,川大智胜对于建立三维人脸识别技术分别列出了开发期、应用开发期和大范围推广应用期3个发展阶段。仅在开发期,就需建立10万人以上的高精度三维全脸库,供算法开发的学习、训练、调试、检验使用。而推广应用期需要采集和建库的三维人脸将超过1亿人。
川大智胜对应用开发期的人脸采集举例称,例如成都某大学拟委托公司把学生宿舍门禁由原来的刷卡改为“刷卡+三维人脸识别”,该校在校本科生、研究生共6.5万人,仅一所大学就需采集6.5万人的三维人脸并建库。
此外,川大智胜还称,公司正和南方某大城市社保基金合作,在该市原采用“刷卡+密码”识别的社保自动柜员机上增加三维人脸识别功能,需要采集该市数10万养老金领取者的三维人脸并建库;预计仅各领域示范工程需采集的三维人脸数据超过1000万人。
对于如此庞大的人脸数据库的计划公司是否能在三年内完成,宋万忠称,“我们现在是在小范围协助用户做建库,大规模建库还没有开始。”
从事人脸识别运营多年的骏聿科技创始人袁存鼎对记者表示,算法的领先水平和持续优化能力是核心竞争力,而算法是“学得越多越准确”,自建数据库是人脸识别公司绕不开的。
人脸生意需过授权关
事实上,对于人脸识别的隐私风险,业界早有争议。此前谷歌、Facebook还因其“人脸技术”泄露公众隐私而陷入官司纠纷。如今人脸识别在中国资本市场风头正劲,但其迅速发展背后的隐私监管隐忧亦显露出来。
而从人脸识别近年来的技术发展来看,要研发出更精准的识别算法,就意味着需要更大规模的人脸数据库。而对于人脸识别厂商来说,核心竞争力在于研发,在于算法的领先水平和持续优化能力。
国内一位信息安全权威人士对记者表示,从隐私的角度讲,授权也是一个问题。国内相关立法没有那么完善,个人隐私保护上一直做得比较差,即便知道个人信息被贩卖也没有人去监管。
在三维人脸识别研发上,川大智胜显得颇为迫切。但授权问题却是川大智胜绕不过的坎,与BAT等巨头的二维人脸识别不同,川大智胜并没有直接用户授权。而在公司拟定增募投1.76亿元的三维人脸识别产业化项目中,亦包含“大规模三维人脸库建设”。而大规模三维人脸库建设显然比二维人脸要困难的多。一位网安人士分析称,二维人脸采集可能从网络抓取就可以完成,在用户授权上无法追责,而三维人脸不太可能在不知情的情况下完成采集,要建立数据库,数据授权肯定绕不开。
宋万忠在对记者的公开回复中表示,三维人脸识别科研也需要建设一个库,也需要得到个人或相关部门的同意。
对于上述高校和社保基金采集建库,宋万忠表示,“采集来的数据不是我们拿来用,也不是放在我们这的。我们只是把软件、算法卖给客户,并且协助客户采集。”但宋万忠也表示,公司有科研建库的需要。
袁存鼎对记者表示,在2013年后,算法商建设人脸数据库成为一件很必要的事,这能提升识别的精确度。但数据库的作用是边际效应递减的,有100万数据量和1000万数据量,对算法精度提升是有限的。
微信扫描二维码,关注公众号。