霍金的徒孙这个身份,给朱珑这位创业者带来了不小的光环。朱珑的老师Alan Yuille教授是国际计算机视觉届奠基人之一,师从霍金。Alan先后就职于MIT人工智能实验室、哈佛大学计算机系,现任职于UCLA统计系,也是UCLA视觉识别与机器学习中心主任。
朱珑出生在福建福州,和他从小一起长大的好友林晨曦也是一位标准的“学霸”,上海交通大学硕士毕业。林晨曦曾经是阿里巴巴的云计算资深专家、技术总监,2008年他跟着王坚从微软亚洲研究院来到了阿里,创造了阿里云的飞天分布式云计算操作系统。
这两个人,一个擅长高精度人工智能算法,一个擅长把人工智能算法高效工程化和产品化的大规模并行计算系统,两个人在2012年联合创业,联手创建了依图科技股份有限公司(以下简称:依图科技)。过去的四年间,这家创业公司成为了一匹人工智能产品化的黑马,接下来他们还想要做更多。
人脸识别和车辆识别的“黑马”
依图科技的第一代人工智能产品也是现在的主要产品为人像识别和车辆识别系统:蜻蜓眼人像识别比对系统、蜻蜓眼车辆识别系统。
其中的人像识别比对系统可在0.5秒级内完成单张人像查询亿级数据库后返回精准结果,领先于国内其它技术供应商的百万级查询水平,也超越了人眼识别平均水平,在青奥会、珠海航展、G20峰会安保系统成功应用。而车辆识别系统则能通过对车辆品牌、型号等精准识别,实现品牌识别、假套牌库分析、基于视觉特征的“以图搜车”,已经用于8个省公安厅,并获2015年公安部科学技术进步奖。
G20期间,宁波市政府在关键路段的地铁站布了10个摄像头,3周抓了9个在逃犯人,其中不乏隐秘多年甚至身份已经洗白者。而从摄像头实时捕捉地铁站画面到后台监控警报响起,中间不超过1秒钟。
林晨曦告诉记者,依图科技在多个项目招标PK中,都排名第一。在近期的公安部出入境管理局招标中,涉及指标包括人脸与护照的照片对比,依图科技在所有投标企业中拿了第一名。去年招商银行的ATM机刷脸取款项目招标,找了18家供应商对1000多个网点的全柜台进行了对比,依图科技依然拿了第一名并成功中标。
依图科技的其它客户还包括苏州市公安局凭借依图科技的蜻蜓眼车辆识别系统应用获得公安部科技进步奖,列入2014年度公安部技成果推荐目录。蜻蜓眼车辆识别系统识别品牌款型超过1000多种、水平居全国首位,车辆捕获率>99%,号牌识别率>95%,车辆品牌识别率>95%。依图科技还与华为的平安城市、阿里云的交通大数据平台、京东金融的身份识别等项目有广泛的合作。
为什么依图科技的人像识别和车辆识别有这么高的精度与效率呢?这首先是因为朱珑的算法是经过了高度的优化,除了大幅提升识别精度外,还在考虑工程优化方面下了很大的功夫。而林晨曦的大规模并行计算工程化经验,则大幅提高了算法的运算效率和优化了工程实践。
根据前瞻产业研究院统计,2015年生物识别技术全球市场规模将达到130 亿美元,2020年将达到250亿美元,5年内年均增速约14%。自2015年到2020年,人脸识别市场规模增长了166.6%,在众多生物识别技术中增幅居于首位,预计到2020年人脸识别技术市场规模将上升至24亿美元。广阔的市场空间,为孕育依图科技这样的黑马提供了前提。
挑战下一个高峰:智能交通
人工智能的应用具有极大的想象空间,阿里巴巴集团技术委员会主席王坚就在云栖大会上重点介绍了其在“城市大脑”项目上的进展。林晨曦告诉钛媒体,他们团队的下一个挑战就是“如何服务于城市交通优化”,这对于依图科技将是一个新高峰。
为什么说城市交通优化是人工智能的新高峰呢?原因在于,城市交通优化往往涉及多个路口的同步并行优化,以及相关车辆、行人、红绿灯等的联动联调,其复杂度远高于视觉识别。而且在城市交通优化领域,即便是全球范围内的学术研究和实践加一起,也没有可以借鉴的成功理念或经验。城市交通优化对于全球人工智能界来说,都是一个探索中的领域。
2016年3月,杭州市政府启动了城市大脑项目,这个项目由杭州市政府主导,由包括阿里云在内13家企业的人工智能科学家参与,依图科技也是13家参与企业中的一家。
所谓“城市大脑”,就是利用人工智能算法,对整个城市进行全局实时分析、自动调配公共资源进行优化,城市交通是第一个要解决的问题。
在“城市大脑”项目中,依图科技的角色是负责道路的建模和车辆行驶轨迹的识别,能具体到每一辆车的行驶轨迹,具体到某辆车于几点几分出现在哪个路口、完成了左拐还是右拐;其次是道路拥堵状况建模和红绿灯关系建模,从而推断车辆的饱和程度、两个红绿灯之间的相位关系(如何识别一路绿灯或红灯)等。
林晨曦介绍说,依图科技现在仅是对一条杭州萧山区最堵的市心路建模,涉及到8个红绿灯、7个路口。其中的难点在于“每天的交通情况都不一样”,既有早高峰与晚高峰的突发因素,也有天气、车祸等不确定因素;此外,传统的道路优化是单个路口,现在是要考虑8个红绿灯整体联调。其中,对道路拥堵建模采取的是深度学习算法,对8个红绿灯联动建模采取的是梯度下降算法。
“城市大脑”的难点在于首先要对现实物理世界建模,而用数据和数学表达对物理世界的刻画一直是人工智能终极挑战之一。“城市大脑”的交通优化要先设计一个对现实物理世界的模拟仿真器,然而在这个模拟仿真器上做大量的数据实验,用机器学习的方式对道路进行建模,再用真实的数据流来验证数学模型的可行性与精度。
林晨曦表示,“城市大脑”要对所有城市每条道路进行建模,然后合并在一起是对整个城市的建模,再对车辆轨迹建、路口和意外事件建模。因此,这是个极为复杂、混合的模型,每个模型是刻画一个小的现实物理世界问题,但结合在一起就异常复杂了。
比如对一个区域建模的最大挑战:一是获取外部环境数据需要跨团队协作,数据采集的精度和实时性等都对算法有影响,因此要协调很多部门;二是研究方面没有可借鉴,美国和世界各地与交通相关的文献中目前没有使用视频数据获得具体车辆个体信息的研究,即使是MIT也没有达到这么深的地步。
过去,智能安防在城市建设中扮演了十分重要的角色,如今,从智能安防到智能交通,这对于人工智能来说是一个质的飞跃。智能安防使用到的人脸识别和车辆识别已经从算法研究推进到了具体的工程化与产品化阶段,而智能交通的研究才刚刚开始。智能安防属于单个问题的优化,而智能交通则是多个问题的同步全局性优化,而且智能交通还涉及到异常和意外情况,因此如果能解决智能交通问题,那就是人工智能的一个历史性飞跃,这也是依图科技希望探索的下一个人工智能高地。
在新人工智能算法的商业化方面,林晨曦认为“要抓用户的刚性需要,待人工智能算法进步到能把问题解决了,商业模式自然就有了”。当然,对城市交通建模与股市建模不一样的地方,在于股市是不受控的场景,但城市交通是有物理约束条件,属于有可能解决的范畴。
依图科技的人像识别和车辆识别软件产品既能部署到客户自己的数据中心里,也能以SaaS的方向对外提供,总部位于上海市并在美国硅谷设有研发中心,已经发展到百余名员工。依图科技目前已获得真格基金天使轮投资,红杉资本、高榕资本A轮融资,今年6月获得云锋基金数千万B轮融资,接下来可能很快展开新一轮融资,主要用于攻关智能交通等难题。
虽然美国掌握着人工智能的核心技术,但中国有庞大的用户与物理世界数据,这也是人工智能进化的必要条件之一。中国在人工智能的全球竞争中能否弯道超车,越来越多的创业者正在寻找答案。
微信扫描二维码,关注公众号。